- 阅读前必读 -
QWEN 千问大模型 · 全量数据
- 话题聚类模型:qwen-max(通过 IdeaLab API)
- 数据源:每个阶段的全量买家消息
- 各阶段消息量:阶段1 ≈ 18,153 条 | 阶段2 ≈ 8,400 条 | 阶段3 ≈ 12,890 条 | 阶段4 ≈ 18,250 条
- 批量大小:BATCH_SIZE = 400,跑完整 4 阶段约 1,500 批
📐 频率% = 该话题命中的买家消息条数 ÷ 本阶段全量消息条数
例:阶段 1「产品兴趣表达」6,154 / 18,153 ≈ 33.9%
CC Claude Code · 抽样数据
- 话题聚类模型:claude-opus-4-6(本地 Claude Code CLI 调用)
- 数据源:每个阶段随机抽样 5,000 条买家消息(随机种子 = 42)
- 抽样原因:CC CLI 调用速率受限,全量跑成本和时长不可控;抽样可在 1 小时内完成
- 批量大小:BATCH_SIZE = 1500,每阶段约 4 批,共 16 批
📐 频率% = 该话题命中的买家消息条数 ÷ 5,000(抽样总量)
例:阶段 1「表达初步采购意向」409 / 5000 ≈ 8.18%
⚠️ 重要提醒:两边的「频率%」与「次数」不能直接比较
分母不同(Qwen 是各阶段全量,CC 是固定 5000);样本规模不同(Qwen ≈ 5.7 万条,CC ≈ 2 万条);
模型颗粒度不同(Qwen 倾向粗聚类,单一话题占比可达 30%+;CC 倾向细聚类,单一话题占比通常 ≤10%)。
本报告的对比重点是:每个阶段两个模型识别出的核心话题构成、命名颗粒度、以及只有一方识别到的"独有话题",而不是绝对数字大小。
技术原理(共用流程)
原始数据
26,505 条
→
数据清洗去重
→ 20,442 条
→
LLM 阶段分类
4 阶段划分
→
买家消息提取
按阶段聚合
→
话题聚类
Qwen 全量 / CC 抽样
→
结果输出
频次排序
前 4 步两边完全相同(基于同一份清洗后的对话数据 + 同一份阶段标签);
差异仅出现在第 5 步「话题聚类」——Qwen 跑全量,CC 跑抽样。
- 阶段话题对比 -
各阶段 TOP 10 话题对比(左:Qwen | 右:Claude Code)
阶段 1 · 需求确认
阶段 2 · 报价成本
阶段 3 · 交易协商
阶段 4 · 订单确认
1
产品兴趣表达
"I'm interested in this product"
2
价格询问
"How much for total?"
3
样品请求
"Can I see a sample?"
5
产品规格确认
"Is COB better than SMD?"
6
定制化需求
"I would like my own logo"
7
运输配送咨询
"How long to ship?"
8
颜色选择
"Show me other colors"
10
产品图片展示
"Send another image?"
Claude Code · 阶段1
分母:5,000 抽样
1
表达初步采购意向
"i'm interested in this product"
2
明确采购数量需求
"I want 100 pieces""500 to start"
4
指定颜色款式偏好CC独有
"i want it black""What color?"
5
确认产品规格尺寸
"Size S""S, M, L, XL"
6
索要产品实拍图视频
"Can I have a photo?"
7
了解产品功能与技术参数CC独有
"What does hot swap mean?"
8
咨询产品定制与加工
"can i add my own logo?"
9
咨询运费与物流时效
"what is the shipping cost?"
10
确认产品型号与适配CC独有
"Compatible with Canon MG6130?"
🔍 阶段 1 差异亮点
- Qwen Top1 一个话题(产品兴趣表达)就吃掉 33.9%,前 3 名累加 60.6%;命名偏粗放、靠"动作词"概括(如"价格询问"、"样品请求")。
- CC Top1 仅 8.2%,分布更平坦;命名偏"动机+对象"句式(如"表达初步采购意向"、"了解产品功能与技术参数"),更像业务语境。
- CC 独有维度:颜色款式偏好、产品功能/技术参数、型号适配(如 Canon MG6130)—— 这些被 Qwen 合并进了"产品规格确认"。
- Qwen 独有维度:"库存确认"和"产品图片展示"在 CC 的 Top10 之外(CC 把"图片"和"实拍图视频"合在一起,"库存"则没进 Top10)。
1
询问含运费总价
"How much including shipping?"
2
询问价格/报价
"What is the exact price?"
3
询问运费
"What is shipping cost?"
4
提供地址核算运费
"NSW, Australia 2259"
5
询问数量和MOQ
"Price for 3000pcs?"
7
运输方式/物流
"Door delivery or to port?"
10
样品相关
"How do I order samples?"
Claude Code · 阶段2
分母:5,000 抽样
1
确认购买数量以获取报价
"200 pcs of the blue lint roller"
2
询问产品单价/报价
"How much for one?"
3
提供地址/目的地以核算运费
"Portland, Oregon, USA"
4
询问运费金额
"how much for shipping?"
5
确认含运费的总成本
"final price including shipping"
6
讨价还价/要求降价
"2.45$ pc is too expensive"
7
核实确认报价明细CC独有
"one box was 23 dollars, why more now?"
8
选择/确认运输方式
"yes sea shipping""use fedex"
9
询问运输时效
"How long would it take?"
10
询问重量/体积/CBM
"How many CBM?"
🔍 阶段 2 差异亮点
- Qwen Top1「询问含运费总价」一项独占 30%,把"询问总价/询问运费/询问价格"几乎合并;强调"裸价 vs 总价"的语义对立。
- CC 把上述话题拆得更细:单价、运费、总价、报价明细分别是独立话题;并新增「核实确认报价明细」(买家追问"为什么这次比上次贵")这种纠错向沟通。
- 共同结论:报价阶段最高频的都是"运费/总价/报价"系列,约占该阶段半数对话——CIF/DDP 思维在两个模型上都成立。
- CC 独有维度:核实报价明细、Logo 定制询价、付款方式询问(在 11-15 名),均被 Qwen 合并到了"价格协商"或没识别到。
1
讨价还价/价格协商
"Can you give me a price discount?"
2
付款方式确认
"I will pay it today"
3
样品请求
"Send me a sample with plastic base"
4
交货时间确认
"Delivery by December 19th right?"
5
定制需求沟通
"Custom logo on both"
7
运费协商
"Shipping cost is a lot, can we reduce?"
8
收货地址确认
"Ellenton Florida 34222"
10
支付链接请求
"Send me payment link"
Claude Code · 阶段3
分母:5,000 抽样
1
讨价还价/要求降价
"what is your best price?"
2
指定产品规格/颜色/尺寸
"Black =12 White =12 Pink=12"
3
询问/协商交货时间
"How long will it take to ship?"
4
协商付款方式
"Which payment method?"
5
确认订购数量
"yes 500 pieces total"
6
定制Logo/品牌个性化
"Can I put my logo?"
7
提供收货地址/物流信息
"New Jersey, USA 08551"
8
请求样品/先试质量再大单
"send us 2 samples"
9
物流方式/快递选择CC独有
"change incoterm to EXW""DHL or FEDEX"
10
表达下单意愿/确认购买CC独有
"sure, I will take it""ok i order"
🔍 阶段 3 差异亮点(差异最大的一个阶段)
- Qwen 仅识别 10 个话题,Top1「讨价还价」直接吃掉 32.9%;过于"集中化",把不同语境的议价都揉到一起。
- CC 在阶段 3 识别出 28 个话题(Top10 之外还长尾),并独家挖出多个细分场景:
▸ 11-28 名 CC 独有话题:「承诺大单换首单优惠」、「延迟付款/资金暂不足」、「关税/低报/清关问题」、「Incoterm 协商(EXW/FOB/CIF)」、「DHL/FEDEX 渠道偏好」、「印刷品控/包装确认」等。
- 结论:阶段 3 是买家"决策反复期"——不只在砍价,还在拉锯付款、清关、物流细节。CC 的细颗粒度更接近 ToB 业务真实场景。
1
确认收货地址
"Via Monti Altissimo 4, Italy"
2
确认已付款
"Payment failed, I'll try again"
3
询问发货时间
"When will you ship?"
4
要求跟踪号码
"I need the tracking number"
8
要求包装唛头标记
"Mark it TARU7025"
9
要求包装照片
"Will it be bubble wrapped?"
Claude Code · 阶段4
分母:5,000 抽样
1
提供/确认收货地址
"Ottawa, ON K1N 5M5, Canada"
2
通知卖家已完成付款
"Just made the payment""Payment done, thank you"
3
请求生成付款链接/创建订单/发票
"Please send a payment link"
4
敲定/修改订单规格与细节
"I want size 40"
5
查询订单发货/物流状态
"Do we have progress on the shipment?"
6
确认预计到货/送达时间
"How many days to Ghana?"
7
催促卖家加快发货CC独有
"help me ship ASAP"
8
提供包裹唛头/标记
"Write on carton Code:m1077"
9
索要物流追踪号
"Tracking number?"
10
承诺即将安排付款CC独有
"I will make payment today""Paying tomorrow"
🔍 阶段 4 差异亮点
- Qwen Top2「确认地址 + 确认已付款」合计 57.7%,把"流程性话题"高度集中。
- CC 把付款拆成三个动作:①通知已付款 ②请求生成付款链接 ③承诺即将付款,分别是 Top2/Top3/Top10,更贴合卖家"是否已收到款"的实际判断。
- CC 还独家识别到「催促卖家加快发货 (ASAP)」这种情绪信号话题——对客服优先级排序很重要。
- 结论:下单后阶段 CC 把"付款链路"拆得更细,能直接对应卖家工作台的几个关键动作(生成链接 / 收款确认 / 跟踪发货)。
综合对比汇总
| 维度 |
Qwen (qwen-max) |
Claude Code (Opus 4.6) |
| 数据源 | 每阶段全量买家消息 | 每阶段随机抽样 5,000 条 |
| 总样本量 | ≈ 57,700 条 | 20,000 条(5,000 × 4) |
| 总识别话题数 | 71 | 96 |
| 阶段3 话题数 | 10 | 28 |
| Top1 话题占比(典型) | 30%-35%(高度集中) | 6%-9%(分布平坦) |
| 命名风格 | 动词短语,偏通用化("价格询问"、"样品请求") | 动机+对象,偏语境化("表达初步采购意向"、"承诺大单换首单优惠") |
| 独家挖掘场景 | 少(话题被合并得较粗) | 多:Incoterm 协商、清关问题、催促发货、付款承诺、技术参数咨询等 |
| 完成耗时 | 约 2 小时(≈ 1500 批 × 并发 5) | 约 1 小时 6 分钟(16 批 × 并发 2) |
| 失败重试 | 少量需补跑 | 0 失败(5 次重试 + 20 分钟超时) |
🎯 一句话结论
- Qwen 优势:跑全量、绝对频次有统计意义,适合 "哪个话题最普遍" 这类宏观问题。
- CC 优势:颗粒度细、命名贴业务、能挖出长尾场景,适合 "还有什么场景被忽略" 这类发现性问题。
- 建议组合使用:用 Qwen 拿大盘占比,用 CC 拿细分洞察——两份结果互补,而非替代。