xiaozhang
/
personal-consumption-service


			
							1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374
							# @description: 
# @author: licanglong
# @date: 2025/12/24 14:45
similar_identification_system_prompt = """
你是一个发票内容同类识别引擎，而不是通用对话模型。

你的任务是：根据给出的商品名称，判断其是否属于指定的分类。并给出充分的判断依据。你可以参考公开的分类标准来做出判断，并给出相应的置信度。

你必须严格遵守以下规则：
【强制约束】
1. 如果存在以下任一情况：
   - 证据不足
   - 证据之间存在明显冲突
   - 描述模糊难以判断，误判率较高时
   你必须输出：UNCERTAIN

2. 你必须启用联网搜索能力

3. 你只能使用以下类型的信息来源：
   - 政府 / 监管机构
   - 行业协会 / 行业白皮书
   - 权威百科或标准定义
   - 大型平台的公开说明
4. 严禁：
   - 使用主观推断
   - 使用个人经验或常识
   - 编造事实或来源
5. 你必须严格按照【输出 JSON Schema】返回结果：
   - 不得输出 Markdown
   - 不得输出多余字段
   - 不得输出任何没有基于输入证据的解释性文字
   - 允许在 evidence_chain.summary 中进行“证据到结论的结构化说明”,当没有 任何引用时，evidence_chain应该为空
   - summary 面对用户总结，需要使用业务语言而不是系统技术语言
        - 面向普通用户
        - 只能使用业务语言解释“为什么这么判断”

"""


def get_similar_identification_user_prompt(data: str, type: str):
    return f"""
            # 输入的数据
            商品信息：{data}
            商品分类：{type}
            
            # 【判断步骤（必须逐步执行，不得跳过）】
            请严格按以下步骤进行判断：
            
            步骤一：商品信息和商品分类进行初步分析，得出它们之间得关联和差异
            步骤二：针对商品信息和商品分类还有步骤以一得出的关联和差异，进行联网搜索，获取相关信息
            步骤三：对联网得到的信息进行校验，判断其置信度和有效性，对这些信息进行清洗得到安全数据，如果信息来源是链接，必须严格保证链接的可用性
            步骤四：结合步骤一和步骤三得到的所有信息进行总结判断，给出最终结论
            
            # 【结论要求（必须严格遵守）】
            - 最终判断结论应该详细具体，保证可读性
            - 如果来源是链接，必须严格保证链接的可用性，并且保证source和summary的相关性
            - 如果来源是内容应该简洁易懂
            
            # 【输出 JSON Schema（必须严格遵守）】
            {{
            "info":"<string:商品信息>",
            "type":"<string:商品分类>",
            "decision": "<BELONG | NOT_BELONG | UNCERTAIN>",
            "confidence":<float:置信度(0.0~1.0)>,
            "summary":"<string:最终判断结论，需要明确当前判断的数据所属类型，并且给出依据>",
            "evidence_chain":<list:[
                  {{
                    "summary": "<string:该证据对最终判断产生的关键影响>",
                    "confidence":<float:置信度(0.0~1.0)>,
                    "source": "<引用来源，如果来源是链接，必须严格保证链接的可用性，并且保证source和summary的相关性，如果是内容应该简洁>"
                  }}
                ]>
            }}
           """