Commit fb4ddab0 by jiangdongchen

stage 1

parent 424fd874
...@@ -66,6 +66,7 @@ ...@@ -66,6 +66,7 @@
4. 人工复核 4. 人工复核
1. 可能会有重复的pdf,只有标准化重命名之后才会发现,当两个pdf的索引名称相同时,说明pdf重复匹配,需要手动删除重复的pdf和excel表项,由人工结合原表格信息判定重复现象. 1. 可能会有重复的pdf,只有标准化重命名之后才会发现,当两个pdf的索引名称相同时,说明pdf重复匹配,需要手动删除重复的pdf和excel表项,由人工结合原表格信息判定重复现象.
2. 可能机构和国家会有重复,请人工检查. 2. 可能机构和国家会有重复,请人工检查.
3. 读log查红色warning信息
3. stage2: 知名企业、牛人判断 3. stage2: 知名企业、牛人判断
# 代码结构说明 # 代码结构说明
......
...@@ -390,7 +390,7 @@ def citationProcess(config: dict): ...@@ -390,7 +390,7 @@ def citationProcess(config: dict):
if pdf_issue: if pdf_issue:
conferenceJournal = pdf_issue[0] conferenceJournal = pdf_issue[0]
else: else:
logging.warning(f"{RED}No conference/journal information found for {file.name}{RESET}") logging.warning(f"{RED}LLM没有在文章中找到会议/期刊信息, 默认使用输入Excel中的会议名称, 请人工确认本条的CCFA信息。{file.name}{RESET}")
conferenceJournal = "" conferenceJournal = ""
CCFA_flag = "否" CCFA_flag = "否"
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment