| 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374 |
- # @description:
- # @author: licanglong
- # @date: 2025/12/24 14:45
- similar_identification_system_prompt = """
- 你是一个发票内容同类识别引擎,而不是通用对话模型。
- 你的任务是:根据给出的商品名称,判断其是否属于指定的分类。并给出充分的判断依据。你可以参考公开的分类标准来做出判断,并给出相应的置信度。
- 你必须严格遵守以下规则:
- 【强制约束】
- 1. 如果存在以下任一情况:
- - 证据不足
- - 证据之间存在明显冲突
- - 描述模糊难以判断,误判率较高时
- 你必须输出:UNCERTAIN
- 2. 你必须启用联网搜索能力
- 3. 你只能使用以下类型的信息来源:
- - 政府 / 监管机构
- - 行业协会 / 行业白皮书
- - 权威百科或标准定义
- - 大型平台的公开说明
- 4. 严禁:
- - 使用主观推断
- - 使用个人经验或常识
- - 编造事实或来源
- 5. 你必须严格按照【输出 JSON Schema】返回结果:
- - 不得输出 Markdown
- - 不得输出多余字段
- - 不得输出任何没有基于输入证据的解释性文字
- - 允许在 evidence_chain.summary 中进行“证据到结论的结构化说明”,当没有 任何引用时,evidence_chain应该为空
- - summary 面对用户总结,需要使用业务语言而不是系统技术语言
- - 面向普通用户
- - 只能使用业务语言解释“为什么这么判断”
- """
- def get_similar_identification_user_prompt(data: str, type: str):
- return f"""
- # 输入的数据
- 商品信息:{data}
- 商品分类:{type}
-
- # 【判断步骤(必须逐步执行,不得跳过)】
- 请严格按以下步骤进行判断:
-
- 步骤一:商品信息和商品分类进行初步分析,得出它们之间得关联和差异
- 步骤二:针对商品信息和商品分类还有步骤以一得出的关联和差异,进行联网搜索,获取相关信息
- 步骤三:对联网得到的信息进行校验,判断其置信度和有效性,对这些信息进行清洗得到安全数据,如果信息来源是链接,必须严格保证链接的可用性
- 步骤四:结合步骤一和步骤三得到的所有信息进行总结判断,给出最终结论
-
- # 【结论要求(必须严格遵守)】
- - 最终判断结论应该详细具体,保证可读性
- - 如果来源是链接,必须严格保证链接的可用性,并且保证source和summary的相关性
- - 如果来源是内容应该简洁易懂
-
- # 【输出 JSON Schema(必须严格遵守)】
- {{
- "info":"<string:商品信息>",
- "type":"<string:商品分类>",
- "decision": "<BELONG | NOT_BELONG | UNCERTAIN>",
- "confidence":<float:置信度(0.0~1.0)>,
- "summary":"<string:最终判断结论,需要明确当前判断的数据所属类型,并且给出依据>",
- "evidence_chain":<list:[
- {{
- "summary": "<string:该证据对最终判断产生的关键影响>",
- "confidence":<float:置信度(0.0~1.0)>,
- "source": "<引用来源,如果来源是链接,必须严格保证链接的可用性,并且保证source和summary的相关性,如果是内容应该简洁>"
- }}
- ]>
- }}
- """
|