基于大型语言模型（LLM）的财务报表分析

论文《Financial Statement Analysis with Large Language Models》研究了大型语言模型（LLM）是否能成功地进行财务报表分析，并预测未来收益的方向。研究的核心是将标准化和匿名化的财务报表提供给GPT-4，要求其分析这些数据以预测未来收益的变化。研究发现，即使没有叙述性或行业特定的信息，LLM在预测收益变化方面的表现优于金融分析师，并且在分析师表现不佳的情况下，LLM的相对优势更加明显。此外，研究表明LLM的预测准确性与狭义训练的最先进的机器学习模型相当。研究还发现，LLM的预测并不是基于其训练记忆，而是生成了关于公司未来表现的有用叙述。基于GPT预测的交易策略比基于其他模型的策略产生了更高的夏普比率和阿尔法值。综合起来，这些结果表明，LLM可能在决策中发挥重要作用。

一、研究设计

无叙述信息的财务报表分析：研究设计的核心在于只提供纯数字的财务报表，而不包括任何管理层讨论和分析（MD&A）等叙述性信息。这一设置使得研究能够评估LLM在缺乏叙述背景下进行财务分析的能力。
两步预测过程：首先将公司的财务报表匿名化和标准化，以防止LLM通过财务数据记住公司。然后设计提示词，指导模型进行财务报表分析，并确定未来收益的方向。
链式思维提示词（CoT）：在简单提示词的基础上，研究进一步开发了链式思维提示词，模拟财务分析师的思维过程，指导模型进行详细的趋势分析、关键财务比率计算和未来收益的预期形成。

二、主要发现

与金融分析师的比较：
- GPT-4使用简单提示词的预测准确率为52%，低于分析师的一个月预测（53%），但使用链式思维提示词后的准确率提高到60%，明显高于分析师预测。
- 分析发现，LLM在分析师表现不佳的情况下具有更高的预测价值，尤其是在分析师预测偏差较大或分歧较高的情况下。
与专业机器学习模型的比较：
- 在与狭义训练的机器学习模型（如人工神经网络ANN）的比较中，GPT-4的预测准确率为60.31%，与ANN模型相当，甚至在某些指标上略高。
经济有用性：
- 基于GPT预测的长短策略在市场上表现优异，产生显著的阿尔法值和夏普比率，尤其是在预测小型公司的收益时表现突出。

三、结论

这篇论文展示了LLM在财务报表分析中的强大能力，不仅在纯数字信息的情况下优于人类分析师，还能够与狭义训练的机器学习模型相媲美。这些发现表明，LLM在未来的财务分析和决策中可能发挥越来越重要的作用。

四、论文贡献

首次提供LLM在大规模财务报表分析中的证据，展示了其在没有叙述背景下进行复杂定量分析的能力。
扩展了LLM的应用边界，表明其在跨领域任务中的潜力，这对于人工智能的发展具有重要意义。
为财务分析领域贡献了新的见解，展示了LLM在生成有价值信息方面的优势。

这篇论文不仅展示了LLM在财务分析中的应用前景，还为未来的研究提供了重要的参考和启示。

一、研究设计

二、主要发现

三、结论

四、论文贡献

相关文章：

发表评论 取消回复

发表评论取消回复