juffaz/python-pandas-parse-group-logs.py

## python-pandas-parse-group-logs.py
import pandas as pd
import re

# Добавление новых данных в DataFrame
data = {
    'key': [
        "/loans-clone/11111111-124221101/accounts",
        "/loans-clone/11111111-124221101/schedule",
        "/loans-clone/22222222-1162201111/accounts",
        "/loans-clone/123456-102228111/accounts",
        "/loans-clone/1234567-116700111/schedule",
        "/loans-clone/by-cif/1844111/active",
        "/loans-clone/collaterals/1899111"
    ],
    'doc_count': [2, 2, 2, 2, 2, 2, 3],  # Замените 0 на фактические значения doc_count
    'api': [None, None, None, None, None, None, None]  # Замените None на фактические значения api
}

df = pd.DataFrame(data)

# Извлечение endpoint без цифр
df['endpoint'] = df['key'].apply(lambda x: re.sub(r'/\d+[-]?\d*', '', x))

# Группировка данных по endpoint и суммирование doc_count
grouped_df = df.groupby('endpoint')['doc_count'].sum().reset_index()

# Вывод результирующего DataFrame
print(grouped_df)
	import pandas as pd
	import re

	# Добавление новых данных в DataFrame
	data = {
	'key': [
	"/loans-clone/11111111-124221101/accounts",
	"/loans-clone/11111111-124221101/schedule",
	"/loans-clone/22222222-1162201111/accounts",
	"/loans-clone/123456-102228111/accounts",
	"/loans-clone/1234567-116700111/schedule",
	"/loans-clone/by-cif/1844111/active",
	"/loans-clone/collaterals/1899111"
	],
	'doc_count': [2, 2, 2, 2, 2, 2, 3], # Замените 0 на фактические значения doc_count
	'api': [None, None, None, None, None, None, None] # Замените None на фактические значения api
	}

	df = pd.DataFrame(data)

	# Извлечение endpoint без цифр
	df['endpoint'] = df['key'].apply(lambda x: re.sub(r'/\d+[-]?\d*', '', x))

	# Группировка данных по endpoint и суммирование doc_count
	grouped_df = df.groupby('endpoint')['doc_count'].sum().reset_index()

	# Вывод результирующего DataFrame
	print(grouped_df)