hiczlf/py

## py
import pprint

# 需要替换的文本
s = """
2020/7/28 9:03:01,姓名:科创,班级：Y1系_1班，年龄：15
2020/7/28 9:03:01,姓名:新三,班级：Y2系_2班，年龄：16
2020/7/28 9:03:01,姓名:创业,班级：Y3系_3班，年龄：17
"""

# 命令后解析
import argparse
parser = argparse.ArgumentParser()
parser.add_argument('file', help='要解析的txt文件路径')
args = parser.parse_args()

# 读取文件
s = open(args.file, 'r').read()

# 替换不标准字符为英文字符, 处理起来比较简单
s = s.replace("，", ",")
s = s.replace("：", ":")


result = []
for line in s.splitlines():
    row = line.split(',')
    item = {}
    if not row or len(row) == 1:
        continue

    # 下面几行的缩进被吃掉了
    item['姓名'] = row[1].split(':')[1]
    item['院系'] = row[2].split(':')[1].split('_')[0]
    item['班级'] = row[2].split(':')[1].split('_')[1]
    item['年龄'] = row[3].split(':')[1]
    result.append(item)

pprint.pprint(result)
	import pprint

	# 需要替换的文本
	s = """
	2020/7/28 9:03:01,姓名:科创,班级：Y1系_1班，年龄：15
	2020/7/28 9:03:01,姓名:新三,班级：Y2系_2班，年龄：16
	2020/7/28 9:03:01,姓名:创业,班级：Y3系_3班，年龄：17
	"""

	# 命令后解析
	import argparse
	parser = argparse.ArgumentParser()
	parser.add_argument('file', help='要解析的txt文件路径')
	args = parser.parse_args()

	# 读取文件
	s = open(args.file, 'r').read()

	# 替换不标准字符为英文字符, 处理起来比较简单
	s = s.replace("，", ",")
	s = s.replace("：", ":")


	result = []
	for line in s.splitlines():
	row = line.split(',')
	item = {}
	if not row or len(row) == 1:
	continue

	# 下面几行的缩进被吃掉了
	item['姓名'] = row[1].split(':')[1]
	item['院系'] = row[2].split(':')[1].split('_')[0]
	item['班级'] = row[2].split(':')[1].split('_')[1]
	item['年龄'] = row[3].split(':')[1]
	result.append(item)

	pprint.pprint(result)