论文How People Use ChatGPT系统刻画了自 2022 年 11 月上线至 2025 年 7 月期间 ChatGPT 消费端(Free/Plus/Pro)的使用结构与扩散轨迹。作者基于隐私保护的自动化分类流程,对代表性对话样本进行多维标注,得到三条主结论:其一,非工作用途增长更快、占比由 53% 上升到 70%+;其二,最常见的三类话题是“实用指导(Practical Guidance)”“寻求信息(Seeking Information)”“写作(Writing)”,合计接近八成;其三,工作场景中“写作”最为突出,体现生成式 AI 相对搜索引擎“直接产出数字化成果”的独特性。与此同时,早期采纳者男性偏多但性别差距显著收敛,并在低收入国家看到相对更快的渗透。
论文作者为Aaron Chatterji, Tom Cunningham, David Deming, Zo¨e Hitzig, Christopher Ong, Carl Shan, Kevin Wadman,来自OpenAI, Duke University和Harvard University。
一、数据来源与隐私保护方法
研究对象为 ChatGPT 消费端历史使用全量的增长指标,以及 2024 年 5 月至 2025 年 6–7 月间随机抽取的约百万级会话样本。对每条用户消息,模型在剥离 PII 后按既定分类提示词进行自动标注(是否与工作相关、对话主题、意图类型、O*NET 工作活动等),并在必要时使用数据洁净室与外部汇总的教育、职业类别进行关联分析。该流程避免人工接触原文内容,以受限标签空间输出统计。
二、使用结构:按“对话主题”的分布
将 24 个底层功能类目聚合为七大主题后发现,最常见的是实用指导、寻求信息与写作,三者合计约占全部会话近八成;与其他研究印象相反,“计算机编程”与“自我表达/关系话题”整体占比较小。工作相关消息中,“写作”尤其占优,凸显 LLM 在“直接生成邮件/文档/摘要/翻译”等方面的比较优势。
三、使用意图:Asking / Doing / Expressing
作者提出“意图三分法”:
1)Asking(提问/咨询)——为更好决策而求知;
2)Doing(代为执行)——请求模型直接产出可投产的结果(如改写邮件、生成报告/表格/代码等);
3)Expressing(表达)——不以获取信息或产出为目的的陈述。
纵向看,2024 年 7 月时 Asking 与 Doing 大致均衡、Expressing 约 <8%;到 2025 年 6 月,Asking 明显走高至 ~51.6%,Doing 降至 ~34.6%,Expressing 升至 ~13.8%。这表明以“决策支持”为目标的使用增长更快。
四、与工作活动的映射(ONET)
研究将消息映射至 ONET 的 332 个“中层工作活动(IWA)”,再聚合为 41 个“广义工作活动(GWA)”。总体上,约 45% 的消息集中在三类“信息使用与处理”活动:获取信息(19.3%)、为他人解释信息(13.1%)与记录/文档化信息(12.8%)。其后是提供咨询与建议、创造性思考、做决策与解决问题、使用计算机等。限定到“工作相关”子样本,排在前列的则是“文档记录”“做决策与解决问题”“创造性思考”“使用计算机”等,合计覆盖近 6 成。这一证据与主题与意图层面的发现相互印证:ChatGPT 在工作中主要承担“信息—决策—创意”的支持角色。
五、工作 vs. 非工作:结构性变化
以自动分类器区分工作/非工作后可见:两类消息量均增长,但非工作增长更快、占比由 2024 年 6 月的 53% 升至 2025 年 6 月的 73%。且这一变化既体现在新进用户,也体现在存量用户“同 cohort 内的用途结构迁移”,说明使用者会随时间逐步发掘更多非工作场景(生活决策、学习辅导、兴趣活动等)。
六、用户画像与扩散
抽样与外部聚合信息显示:早期用户男性占比较高,但至 2025 年中期已接近甚至出现女性占优迹象;同时,过去一年低/中等收入国家的渗透增速更高,表明 ChatGPT 的全球扩散呈“由高收入市场向更广人群加速外溢”的态势。
七、质量与体验
在“意图”维度上,Asking 类消息不仅增长更快,也更易获得较高的交互质量评价;这与其“辅助理解与决策”的属性相关,模型在循证说明、比较评估与情境化建议上的产出更容易被用户认可。(文中以自动化的“交互质量”分类器与用户显性反馈交叉验证,纵向显示 Good/Bad 比显著改善。)
八、与既有研究的对照与贡献
与仅覆盖特定群体或规模较小的平台数据的文献相比,本文样本更大、覆盖期更长,并引入统一的自动化分类流程与多轴度量(主题—意图—O*NET),因此在“生成式 AI 的真实使用结构”与“劳动经济学语境下的功能定位(决策支持 VS. 任务产出)”上提供了更具代表性的证据。论文还强调:写作在工作场景中一骑绝尘,而“编程”与“社交/情感”类占比并不高,纠正了社会舆论对高频用途的某些刻板印象。
九、现实启示
1)对个人:把 ChatGPT 当作“决策副驾”,优先用于信息整合、权衡取舍与结构化表达,可获得更稳定的质量回报(Asking→Doing 的工作流)。
2)对团队与组织:写作相关流程(邮件/报告/方案/摘要/翻译/校改)仍是立竿见影的效能抓手;对知识密集岗位,可围绕“获取与解释信息—创意与决策”设计标准化提示与质检闭环。
3)对公共政策与教育:辅导/教学类需求占比可观,应加快人机协同教学法、形成性评价与学术诚信规范建设,避免单纯的“替写”误用。以上判断与数据结果相互一致。
十、方法学与局限
尽管采用了去标识化与自动化分类,但分类器本身仍可能受提示词设定与长上下文截断的影响;此外,样本覆盖消费端用户,企业版/教育版等其他产品线的结构可能不同,外推时需谨慎。这些在文中已加以说明并通过公共语料集做了验证与对比。
十一、总结
总体而言,本文以大样本与多维标签清晰刻画了“人们如何使用 ChatGPT”:使用正在从“请模型替我做(Doing)”逐步向“请模型帮我想清楚(Asking)”倾斜;在工作中,写作相关任务最能释放价值;在职业活动的语义映射上,模型主要赋能“信息—解释—记录”与“决策—建议—创造”两大类活动。这为组织落地生成式 AI、并在经济学语境下理解其生产率与福利效应,提供了坚实的事实基础。