Commit fb4ddab0 by jiangdongchen

stage 1

parent 424fd874
......@@ -66,6 +66,7 @@
4. 人工复核
1. 可能会有重复的pdf,只有标准化重命名之后才会发现,当两个pdf的索引名称相同时,说明pdf重复匹配,需要手动删除重复的pdf和excel表项,由人工结合原表格信息判定重复现象.
2. 可能机构和国家会有重复,请人工检查.
3. 读log查红色warning信息
3. stage2: 知名企业、牛人判断
# 代码结构说明
......
......@@ -390,7 +390,7 @@ def citationProcess(config: dict):
if pdf_issue:
conferenceJournal = pdf_issue[0]
else:
logging.warning(f"{RED}No conference/journal information found for {file.name}{RESET}")
logging.warning(f"{RED}LLM没有在文章中找到会议/期刊信息, 默认使用输入Excel中的会议名称, 请人工确认本条的CCFA信息。{file.name}{RESET}")
conferenceJournal = ""
CCFA_flag = "否"
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment