Commit 2c426667 by jiangdongchen

log

parent f5127432
......@@ -66,7 +66,7 @@
4. 人工复核
1. 可能会有重复的pdf,只有标准化重命名之后才会发现,当两个pdf的索引名称相同时,说明pdf重复匹配,需要手动删除重复的pdf和excel表项,由人工结合原表格信息判定重复现象.
2. 可能机构和国家会有重复,请人工检查.
3. stage2: 国家机构索引、牛人判断
3. stage2: 知名企业、牛人判断
# 代码结构说明
1. psrc文件夹下是库函数
......
......@@ -352,7 +352,7 @@ def citationProcess(config: dict):
if cit_id is not None:
sheet.cell(row=idx+config["content_start"], column=6, value=cit_id) # 第6列是cit_id
else:
logging.warning(f"{RED}cit_id is None.{RESET}")
logging.warning(f"{RED}cit_id is None.可能存在多个pdf版本,请找到真正引用的版本(T_T){RESET}")
authors_list = result_dict.get("Authors", [])
authors = ";".join(authors_list) if isinstance(authors_list, list) else ""
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment