买家话题分析 - 双模型对比报告 (Qwen vs Claude Code)

20,442

有效对话数（共用）

销售阶段（共用）

Qwen 识别话题数

Claude Code 识别话题数

- 阅读前必读 -

QWEN 千问大模型 · 全量数据

话题聚类模型：qwen-max（通过 IdeaLab API）
数据源：每个阶段的全量买家消息
各阶段消息量：阶段1 ≈ 18,153 条｜阶段2 ≈ 8,400 条｜阶段3 ≈ 12,890 条｜阶段4 ≈ 18,250 条
批量大小：BATCH_SIZE = 400，跑完整 4 阶段约 1,500 批

📐 频率% = 该话题命中的买家消息条数 ÷ 本阶段全量消息条数
例：阶段 1「产品兴趣表达」6,154 / 18,153 ≈ 33.9%

CC Claude Code · 抽样数据

话题聚类模型：claude-opus-4-6（本地 Claude Code CLI 调用）
数据源：每个阶段随机抽样 5,000 条买家消息（随机种子 = 42）
抽样原因：CC CLI 调用速率受限，全量跑成本和时长不可控；抽样可在 1 小时内完成
批量大小：BATCH_SIZE = 1500，每阶段约 4 批，共 16 批

📐 频率% = 该话题命中的买家消息条数 ÷ 5,000（抽样总量）
例：阶段 1「表达初步采购意向」409 / 5000 ≈ 8.18%

⚠️ 重要提醒：两边的「频率%」与「次数」不能直接比较
分母不同（Qwen 是各阶段全量，CC 是固定 5000）；样本规模不同（Qwen ≈ 5.7 万条，CC ≈ 2 万条）；模型颗粒度不同（Qwen 倾向粗聚类，单一话题占比可达 30%+；CC 倾向细聚类，单一话题占比通常 ≤10%）。
本报告的对比重点是：每个阶段两个模型识别出的核心话题构成、命名颗粒度、以及只有一方识别到的"独有话题"，而不是绝对数字大小。

技术原理（共用流程）

原始数据
26,505 条

→

数据清洗去重
→ 20,442 条

→

LLM 阶段分类
4 阶段划分

→

买家消息提取
按阶段聚合

→

话题聚类
Qwen 全量 / CC 抽样

→

结果输出
频次排序

前 4 步两边完全相同（基于同一份清洗后的对话数据 + 同一份阶段标签）；差异仅出现在第 5 步「话题聚类」——Qwen 跑全量，CC 跑抽样。

- 阶段话题对比 -

各阶段 TOP 10 话题对比（左：Qwen ｜右：Claude Code）

阶段 1 · 需求确认

阶段 2 · 报价成本

阶段 3 · 交易协商

阶段 4 · 订单确认

Qwen · 阶段1

分母：18,153 条全量

产品兴趣表达

"I'm interested in this product"

33.9%

6,154 次

价格询问

"How much for total?"

17.4%

3,157 次

样品请求

"Can I see a sample?"

9.3%

1,687 次

订购数量确认

"100 pieces"

8.6%

1,567 次

产品规格确认

"Is COB better than SMD?"

7.8%

1,408 次

定制化需求

"I would like my own logo"

4.8%

871 次

运输配送咨询

"How long to ship?"

4.3%

785 次

颜色选择

"Show me other colors"

3.3%

604 次

库存确认

"Still available?"

3.2%

578 次

产品图片展示

"Send another image?"

2.3%

422 次

Claude Code · 阶段1

分母：5,000 抽样

表达初步采购意向

"i'm interested in this product"

8.2%

409 次

明确采购数量需求

"I want 100 pieces""500 to start"

6.5%

325 次

初步了解产品价格

"Hi how much?"

4.4%

220 次

指定颜色款式偏好CC独有

"i want it black""What color?"

3.4%

168 次

确认产品规格尺寸

"Size S""S, M, L, XL"

3.2%

162 次

索要产品实拍图视频

"Can I have a photo?"

2.8%

139 次

了解产品功能与技术参数CC独有

"What does hot swap mean?"

2.7%

134 次

咨询产品定制与加工

"can i add my own logo?"

2.4%

121 次

咨询运费与物流时效

"what is the shipping cost?"

2.3%

117 次

确认产品型号与适配CC独有

"Compatible with Canon MG6130?"

2.1%

107 次

🔍 阶段 1 差异亮点

Qwen Top1 一个话题（产品兴趣表达）就吃掉 33.9%，前 3 名累加 60.6%；命名偏粗放、靠"动作词"概括（如"价格询问"、"样品请求"）。
CC Top1 仅 8.2%，分布更平坦；命名偏"动机+对象"句式（如"表达初步采购意向"、"了解产品功能与技术参数"），更像业务语境。
CC 独有维度：颜色款式偏好、产品功能/技术参数、型号适配（如 Canon MG6130）—— 这些被 Qwen 合并进了"产品规格确认"。
Qwen 独有维度："库存确认"和"产品图片展示"在 CC 的 Top10 之外（CC 把"图片"和"实拍图视频"合在一起，"库存"则没进 Top10）。

Qwen · 阶段2

分母：8,400 条全量

询问含运费总价

"How much including shipping?"

30.0%

2,520 次

询问价格/报价

"What is the exact price?"

12.2%

1,025 次

询问运费

"What is shipping cost?"

10.5%

880 次

提供地址核算运费

"NSW, Australia 2259"

10.0%

835 次

询问数量和MOQ

"Price for 3000pcs?"

6.7%

565 次

运输时间/交期

"How many days?"

5.8%

483 次

运输方式/物流

"Door delivery or to port?"

5.1%

425 次

价格协商/议价

"Any discount?"

3.0%

252 次

重量包装信息

"How many CBM?"

2.3%

197 次

样品相关

"How do I order samples?"

2.1%

177 次

Claude Code · 阶段2

分母：5,000 抽样

确认购买数量以获取报价

"200 pcs of the blue lint roller"

8.7%

435 次

询问产品单价/报价

"How much for one?"

6.9%

345 次

提供地址/目的地以核算运费

"Portland, Oregon, USA"

6.4%

322 次

询问运费金额

"how much for shipping?"

5.3%

267 次

确认含运费的总成本

"final price including shipping"

3.9%

197 次

讨价还价/要求降价

"2.45$ pc is too expensive"

3.7%

185 次

核实确认报价明细CC独有

"one box was 23 dollars, why more now?"

2.5%

123 次

选择/确认运输方式

"yes sea shipping""use fedex"

2.4%

122 次

询问运输时效

"How long would it take?"

2.4%

120 次

询问重量/体积/CBM

"How many CBM?"

1.5%

76 次

🔍 阶段 2 差异亮点

Qwen Top1「询问含运费总价」一项独占 30%，把"询问总价/询问运费/询问价格"几乎合并；强调"裸价 vs 总价"的语义对立。
CC 把上述话题拆得更细：单价、运费、总价、报价明细分别是独立话题；并新增「核实确认报价明细」（买家追问"为什么这次比上次贵"）这种纠错向沟通。
共同结论：报价阶段最高频的都是"运费/总价/报价"系列，约占该阶段半数对话——CIF/DDP 思维在两个模型上都成立。
CC 独有维度：核实报价明细、Logo 定制询价、付款方式询问（在 11-15 名），均被 Qwen 合并到了"价格协商"或没识别到。

Qwen · 阶段3

分母：12,890 条全量

讨价还价/价格协商

"Can you give me a price discount?"

32.9%

4,243 次

付款方式确认

"I will pay it today"

15.6%

2,016 次

样品请求

"Send me a sample with plastic base"

11.4%

1,468 次

交货时间确认

"Delivery by December 19th right?"

11.3%

1,451 次

定制需求沟通

"Custom logo on both"

10.0%

1,288 次

订单数量确认

"I order 5 pieces"

6.7%

867 次

运费协商

"Shipping cost is a lot, can we reduce?"

3.5%

455 次

收货地址确认

"Ellenton Florida 34222"

3.4%

444 次

产品规格确认

"Size 7 and 9"

1.1%

138 次

支付链接请求

"Send me payment link"

0.9%

118 次

Claude Code · 阶段3

分母：5,000 抽样

讨价还价/要求降价

"what is your best price?"

6.7%

333 次

指定产品规格/颜色/尺寸

"Black =12 White =12 Pink=12"

4.1%

207 次

询问/协商交货时间

"How long will it take to ship?"

3.6%

179 次

协商付款方式

"Which payment method?"

3.6%

178 次

确认订购数量

"yes 500 pieces total"

2.6%

130 次

定制Logo/品牌个性化

"Can I put my logo?"

2.4%

122 次

提供收货地址/物流信息

"New Jersey, USA 08551"

2.4%

119 次

请求样品/先试质量再大单

"send us 2 samples"

2.1%

106 次

物流方式/快递选择CC独有

"change incoterm to EXW""DHL or FEDEX"

2.0%

100 次

表达下单意愿/确认购买CC独有

"sure, I will take it""ok i order"

1.8%

88 次

🔍 阶段 3 差异亮点（差异最大的一个阶段）

Qwen 仅识别 10 个话题，Top1「讨价还价」直接吃掉 32.9%；过于"集中化"，把不同语境的议价都揉到一起。
CC 在阶段 3 识别出 28 个话题（Top10 之外还长尾），并独家挖出多个细分场景：
▸ 11-28 名 CC 独有话题：「承诺大单换首单优惠」、「延迟付款/资金暂不足」、「关税/低报/清关问题」、「Incoterm 协商（EXW/FOB/CIF）」、「DHL/FEDEX 渠道偏好」、「印刷品控/包装确认」等。
结论：阶段 3 是买家"决策反复期"——不只在砍价，还在拉锯付款、清关、物流细节。CC 的细颗粒度更接近 ToB 业务真实场景。

Qwen · 阶段4

分母：18,250 条全量

确认收货地址

"Via Monti Altissimo 4, Italy"

34.6%

6,310 次

确认已付款

"Payment failed, I'll try again"

23.1%

4,210 次

询问发货时间

"When will you ship?"

10.1%

1,847 次

要求跟踪号码

"I need the tracking number"

6.4%

1,161 次

要求发票

"Make me an invoice"

4.7%

866 次

确认订单数量规格

"All size 9.5"

3.8%

687 次

确认产品规格

"Light gray color"

3.1%

560 次

要求包装唛头标记

"Mark it TARU7025"

3.0%

541 次

要求包装照片

"Will it be bubble wrapped?"

2.2%

406 次

要求支付链接

"Send me the link"

2.2%

397 次

Claude Code · 阶段4

分母：5,000 抽样

提供/确认收货地址

"Ottawa, ON K1N 5M5, Canada"

7.9%

395 次

通知卖家已完成付款

"Just made the payment""Payment done, thank you"

6.1%

306 次

请求生成付款链接/创建订单/发票

"Please send a payment link"

3.7%

183 次

敲定/修改订单规格与细节

"I want size 40"

3.6%

180 次

查询订单发货/物流状态

"Do we have progress on the shipment?"

2.0%

100 次

确认预计到货/送达时间

"How many days to Ghana?"

2.0%

99 次

催促卖家加快发货CC独有

"help me ship ASAP"

1.7%

87 次

提供包裹唛头/标记

"Write on carton Code:m1077"

1.6%

82 次

索要物流追踪号

"Tracking number?"

1.5%

75 次

承诺即将安排付款CC独有

"I will make payment today""Paying tomorrow"

1.4%

70 次

🔍 阶段 4 差异亮点

Qwen Top2「确认地址 + 确认已付款」合计 57.7%，把"流程性话题"高度集中。
CC 把付款拆成三个动作：①通知已付款 ②请求生成付款链接 ③承诺即将付款，分别是 Top2/Top3/Top10，更贴合卖家"是否已收到款"的实际判断。
CC 还独家识别到「催促卖家加快发货 (ASAP)」这种情绪信号话题——对客服优先级排序很重要。
结论：下单后阶段 CC 把"付款链路"拆得更细，能直接对应卖家工作台的几个关键动作（生成链接 / 收款确认 / 跟踪发货）。

综合对比汇总

维度	Qwen (qwen-max)	Claude Code (Opus 4.6)
数据源	每阶段全量买家消息	每阶段随机抽样 5,000 条
总样本量	≈ 57,700 条	20,000 条（5,000 × 4）
总识别话题数	71	96
阶段3 话题数	10	28
Top1 话题占比（典型）	30%-35%（高度集中）	6%-9%（分布平坦）
命名风格	动词短语，偏通用化（"价格询问"、"样品请求"）	动机+对象，偏语境化（"表达初步采购意向"、"承诺大单换首单优惠"）
独家挖掘场景	少（话题被合并得较粗）	多：Incoterm 协商、清关问题、催促发货、付款承诺、技术参数咨询等
完成耗时	约 2 小时（≈ 1500 批 × 并发 5）	约 1 小时 6 分钟（16 批 × 并发 2）
失败重试	少量需补跑	0 失败（5 次重试 + 20 分钟超时）

🎯 一句话结论

Qwen 优势：跑全量、绝对频次有统计意义，适合 "哪个话题最普遍" 这类宏观问题。
CC 优势：颗粒度细、命名贴业务、能挖出长尾场景，适合 "还有什么场景被忽略" 这类发现性问题。
建议组合使用：用 Qwen 拿大盘占比，用 CC 拿细分洞察——两份结果互补，而非替代。

买家话题分析 · 双模型对比报告

QWEN 千问大模型 · 全量数据

CC Claude Code · 抽样数据

技术原理（共用流程）

各阶段 TOP 10 话题对比（左：Qwen ｜ 右：Claude Code）

综合对比汇总

各阶段 TOP 10 话题对比（左：Qwen ｜右：Claude Code）