买家话题分析 · 双模型对比报告

同一份对话数据,分别用 千问 (Qwen)Claude Code (Opus 4.6) 跑话题聚类,看模型差异

底层数据:2024 年 12 月份 ab-pro 买卖家聊天数据 | 去重后有效对话 20,442 条
20,442
有效对话数(共用)
4
销售阶段(共用)
71
Qwen 识别话题数
96
Claude Code 识别话题数
- 阅读前必读 -

QWEN 千问大模型 · 全量数据

  • 话题聚类模型:qwen-max(通过 IdeaLab API)
  • 数据源:每个阶段的全量买家消息
  • 各阶段消息量:阶段1 ≈ 18,153 条 | 阶段2 ≈ 8,400 条 | 阶段3 ≈ 12,890 条 | 阶段4 ≈ 18,250 条
  • 批量大小:BATCH_SIZE = 400,跑完整 4 阶段约 1,500 批
📐 频率% = 该话题命中的买家消息条数 ÷ 本阶段全量消息条数
例:阶段 1「产品兴趣表达」6,154 / 18,153 ≈ 33.9%

CC Claude Code · 抽样数据

  • 话题聚类模型:claude-opus-4-6(本地 Claude Code CLI 调用)
  • 数据源:每个阶段随机抽样 5,000 条买家消息(随机种子 = 42)
  • 抽样原因:CC CLI 调用速率受限,全量跑成本和时长不可控;抽样可在 1 小时内完成
  • 批量大小:BATCH_SIZE = 1500,每阶段约 4 批,共 16 批
📐 频率% = 该话题命中的买家消息条数 ÷ 5,000(抽样总量)
例:阶段 1「表达初步采购意向」409 / 5000 ≈ 8.18%
⚠️ 重要提醒:两边的「频率%」与「次数」不能直接比较
分母不同(Qwen 是各阶段全量,CC 是固定 5000);样本规模不同(Qwen ≈ 5.7 万条,CC ≈ 2 万条); 模型颗粒度不同(Qwen 倾向粗聚类,单一话题占比可达 30%+;CC 倾向细聚类,单一话题占比通常 ≤10%)。
本报告的对比重点是:每个阶段两个模型识别出的核心话题构成、命名颗粒度、以及只有一方识别到的"独有话题",而不是绝对数字大小。

技术原理(共用流程)

原始数据
26,505 条
数据清洗去重
→ 20,442 条
LLM 阶段分类
4 阶段划分
买家消息提取
按阶段聚合
话题聚类
Qwen 全量 / CC 抽样
结果输出
频次排序

前 4 步两边完全相同(基于同一份清洗后的对话数据 + 同一份阶段标签); 差异仅出现在第 5 步「话题聚类」——Qwen 跑全量,CC 跑抽样。

- 阶段话题对比 -

各阶段 TOP 10 话题对比(左:Qwen | 右:Claude Code)

阶段 1 · 需求确认
阶段 2 · 报价成本
阶段 3 · 交易协商
阶段 4 · 订单确认
Qwen · 阶段1
分母:18,153 条全量
1
产品兴趣表达
"I'm interested in this product"
33.9%
6,154 次
2
价格询问
"How much for total?"
17.4%
3,157 次
3
样品请求
"Can I see a sample?"
9.3%
1,687 次
4
订购数量确认
"100 pieces"
8.6%
1,567 次
5
产品规格确认
"Is COB better than SMD?"
7.8%
1,408 次
6
定制化需求
"I would like my own logo"
4.8%
871 次
7
运输配送咨询
"How long to ship?"
4.3%
785 次
8
颜色选择
"Show me other colors"
3.3%
604 次
9
库存确认
"Still available?"
3.2%
578 次
10
产品图片展示
"Send another image?"
2.3%
422 次
Claude Code · 阶段1
分母:5,000 抽样
1
表达初步采购意向
"i'm interested in this product"
8.2%
409 次
2
明确采购数量需求
"I want 100 pieces""500 to start"
6.5%
325 次
3
初步了解产品价格
"Hi how much?"
4.4%
220 次
4
指定颜色款式偏好CC独有
"i want it black""What color?"
3.4%
168 次
5
确认产品规格尺寸
"Size S""S, M, L, XL"
3.2%
162 次
6
索要产品实拍图视频
"Can I have a photo?"
2.8%
139 次
7
了解产品功能与技术参数CC独有
"What does hot swap mean?"
2.7%
134 次
8
咨询产品定制与加工
"can i add my own logo?"
2.4%
121 次
9
咨询运费与物流时效
"what is the shipping cost?"
2.3%
117 次
10
确认产品型号与适配CC独有
"Compatible with Canon MG6130?"
2.1%
107 次
🔍 阶段 1 差异亮点
  • Qwen Top1 一个话题(产品兴趣表达)就吃掉 33.9%,前 3 名累加 60.6%;命名偏粗放、靠"动作词"概括(如"价格询问"、"样品请求")。
  • CC Top1 仅 8.2%,分布更平坦;命名偏"动机+对象"句式(如"表达初步采购意向"、"了解产品功能与技术参数"),更像业务语境。
  • CC 独有维度:颜色款式偏好、产品功能/技术参数、型号适配(如 Canon MG6130)—— 这些被 Qwen 合并进了"产品规格确认"。
  • Qwen 独有维度:"库存确认"和"产品图片展示"在 CC 的 Top10 之外(CC 把"图片"和"实拍图视频"合在一起,"库存"则没进 Top10)。
Qwen · 阶段2
分母:8,400 条全量
1
询问含运费总价
"How much including shipping?"
30.0%
2,520 次
2
询问价格/报价
"What is the exact price?"
12.2%
1,025 次
3
询问运费
"What is shipping cost?"
10.5%
880 次
4
提供地址核算运费
"NSW, Australia 2259"
10.0%
835 次
5
询问数量和MOQ
"Price for 3000pcs?"
6.7%
565 次
6
运输时间/交期
"How many days?"
5.8%
483 次
7
运输方式/物流
"Door delivery or to port?"
5.1%
425 次
8
价格协商/议价
"Any discount?"
3.0%
252 次
9
重量包装信息
"How many CBM?"
2.3%
197 次
10
样品相关
"How do I order samples?"
2.1%
177 次
Claude Code · 阶段2
分母:5,000 抽样
1
确认购买数量以获取报价
"200 pcs of the blue lint roller"
8.7%
435 次
2
询问产品单价/报价
"How much for one?"
6.9%
345 次
3
提供地址/目的地以核算运费
"Portland, Oregon, USA"
6.4%
322 次
4
询问运费金额
"how much for shipping?"
5.3%
267 次
5
确认含运费的总成本
"final price including shipping"
3.9%
197 次
6
讨价还价/要求降价
"2.45$ pc is too expensive"
3.7%
185 次
7
核实确认报价明细CC独有
"one box was 23 dollars, why more now?"
2.5%
123 次
8
选择/确认运输方式
"yes sea shipping""use fedex"
2.4%
122 次
9
询问运输时效
"How long would it take?"
2.4%
120 次
10
询问重量/体积/CBM
"How many CBM?"
1.5%
76 次
🔍 阶段 2 差异亮点
  • Qwen Top1「询问含运费总价」一项独占 30%,把"询问总价/询问运费/询问价格"几乎合并;强调"裸价 vs 总价"的语义对立。
  • CC 把上述话题拆得更细:单价、运费、总价、报价明细分别是独立话题;并新增「核实确认报价明细」(买家追问"为什么这次比上次贵")这种纠错向沟通。
  • 共同结论:报价阶段最高频的都是"运费/总价/报价"系列,约占该阶段半数对话——CIF/DDP 思维在两个模型上都成立。
  • CC 独有维度:核实报价明细、Logo 定制询价、付款方式询问(在 11-15 名),均被 Qwen 合并到了"价格协商"或没识别到。
Qwen · 阶段3
分母:12,890 条全量
1
讨价还价/价格协商
"Can you give me a price discount?"
32.9%
4,243 次
2
付款方式确认
"I will pay it today"
15.6%
2,016 次
3
样品请求
"Send me a sample with plastic base"
11.4%
1,468 次
4
交货时间确认
"Delivery by December 19th right?"
11.3%
1,451 次
5
定制需求沟通
"Custom logo on both"
10.0%
1,288 次
6
订单数量确认
"I order 5 pieces"
6.7%
867 次
7
运费协商
"Shipping cost is a lot, can we reduce?"
3.5%
455 次
8
收货地址确认
"Ellenton Florida 34222"
3.4%
444 次
9
产品规格确认
"Size 7 and 9"
1.1%
138 次
10
支付链接请求
"Send me payment link"
0.9%
118 次
Claude Code · 阶段3
分母:5,000 抽样
1
讨价还价/要求降价
"what is your best price?"
6.7%
333 次
2
指定产品规格/颜色/尺寸
"Black =12 White =12 Pink=12"
4.1%
207 次
3
询问/协商交货时间
"How long will it take to ship?"
3.6%
179 次
4
协商付款方式
"Which payment method?"
3.6%
178 次
5
确认订购数量
"yes 500 pieces total"
2.6%
130 次
6
定制Logo/品牌个性化
"Can I put my logo?"
2.4%
122 次
7
提供收货地址/物流信息
"New Jersey, USA 08551"
2.4%
119 次
8
请求样品/先试质量再大单
"send us 2 samples"
2.1%
106 次
9
物流方式/快递选择CC独有
"change incoterm to EXW""DHL or FEDEX"
2.0%
100 次
10
表达下单意愿/确认购买CC独有
"sure, I will take it""ok i order"
1.8%
88 次
🔍 阶段 3 差异亮点(差异最大的一个阶段)
  • Qwen 仅识别 10 个话题,Top1「讨价还价」直接吃掉 32.9%;过于"集中化",把不同语境的议价都揉到一起。
  • CC 在阶段 3 识别出 28 个话题(Top10 之外还长尾),并独家挖出多个细分场景:
    11-28 名 CC 独有话题:「承诺大单换首单优惠」、「延迟付款/资金暂不足」、「关税/低报/清关问题」、「Incoterm 协商(EXW/FOB/CIF)」、「DHL/FEDEX 渠道偏好」、「印刷品控/包装确认」等。
  • 结论:阶段 3 是买家"决策反复期"——不只在砍价,还在拉锯付款、清关、物流细节。CC 的细颗粒度更接近 ToB 业务真实场景。
Qwen · 阶段4
分母:18,250 条全量
1
确认收货地址
"Via Monti Altissimo 4, Italy"
34.6%
6,310 次
2
确认已付款
"Payment failed, I'll try again"
23.1%
4,210 次
3
询问发货时间
"When will you ship?"
10.1%
1,847 次
4
要求跟踪号码
"I need the tracking number"
6.4%
1,161 次
5
要求发票
"Make me an invoice"
4.7%
866 次
6
确认订单数量规格
"All size 9.5"
3.8%
687 次
7
确认产品规格
"Light gray color"
3.1%
560 次
8
要求包装唛头标记
"Mark it TARU7025"
3.0%
541 次
9
要求包装照片
"Will it be bubble wrapped?"
2.2%
406 次
10
要求支付链接
"Send me the link"
2.2%
397 次
Claude Code · 阶段4
分母:5,000 抽样
1
提供/确认收货地址
"Ottawa, ON K1N 5M5, Canada"
7.9%
395 次
2
通知卖家已完成付款
"Just made the payment""Payment done, thank you"
6.1%
306 次
3
请求生成付款链接/创建订单/发票
"Please send a payment link"
3.7%
183 次
4
敲定/修改订单规格与细节
"I want size 40"
3.6%
180 次
5
查询订单发货/物流状态
"Do we have progress on the shipment?"
2.0%
100 次
6
确认预计到货/送达时间
"How many days to Ghana?"
2.0%
99 次
7
催促卖家加快发货CC独有
"help me ship ASAP"
1.7%
87 次
8
提供包裹唛头/标记
"Write on carton Code:m1077"
1.6%
82 次
9
索要物流追踪号
"Tracking number?"
1.5%
75 次
10
承诺即将安排付款CC独有
"I will make payment today""Paying tomorrow"
1.4%
70 次
🔍 阶段 4 差异亮点
  • Qwen Top2「确认地址 + 确认已付款」合计 57.7%,把"流程性话题"高度集中。
  • CC 把付款拆成三个动作:①通知已付款 ②请求生成付款链接 ③承诺即将付款,分别是 Top2/Top3/Top10,更贴合卖家"是否已收到款"的实际判断。
  • CC 还独家识别到「催促卖家加快发货 (ASAP)」这种情绪信号话题——对客服优先级排序很重要。
  • 结论:下单后阶段 CC 把"付款链路"拆得更细,能直接对应卖家工作台的几个关键动作(生成链接 / 收款确认 / 跟踪发货)。

综合对比汇总

维度 Qwen (qwen-max) Claude Code (Opus 4.6)
数据源每阶段全量买家消息每阶段随机抽样 5,000 条
总样本量≈ 57,700 条20,000 条(5,000 × 4)
总识别话题数7196
阶段3 话题数1028
Top1 话题占比(典型)30%-35%(高度集中)6%-9%(分布平坦)
命名风格动词短语,偏通用化("价格询问"、"样品请求")动机+对象,偏语境化("表达初步采购意向"、"承诺大单换首单优惠")
独家挖掘场景少(话题被合并得较粗)多:Incoterm 协商、清关问题、催促发货、付款承诺、技术参数咨询等
完成耗时约 2 小时(≈ 1500 批 × 并发 5)约 1 小时 6 分钟(16 批 × 并发 2)
失败重试少量需补跑0 失败(5 次重试 + 20 分钟超时)
🎯 一句话结论
  • Qwen 优势:跑全量、绝对频次有统计意义,适合 "哪个话题最普遍" 这类宏观问题。
  • CC 优势:颗粒度细、命名贴业务、能挖出长尾场景,适合 "还有什么场景被忽略" 这类发现性问题。
  • 建议组合使用:用 Qwen 拿大盘占比,用 CC 拿细分洞察——两份结果互补,而非替代。