2024年08月
アナリストのセンチメントとAI
本稿では、MFSのクオンツ株式リサーチ・チームがブレンデッド・リサーチ運用で実施したアナリスト・センチメント・スコアリングの強化策についてご説明します。アナリストのセンチメントを定量化するツールとして、新たに大規模言語モデル「FinBERT」を採用しました。
Noah C. Rumpf, Director
ディレクター
クオンツ株式リサーチ
Nathan G. Bryant, CFA
クオンツ・リサーチ・アナリスト
Shruthi Saralaya
クオンツ・システム・アナリスト
MFSブレンデッド・リサーチ運用は、クオンツとファンダメンタルズの両方のインプットを組み合わせたアルファ・シグナルを用いて運用する株式運用戦略です。ファンダメンタルズのアルファ・シグナルにはリサーチ・アナリストが担当する銘柄に対する見解を捉える特徴がいくつかあります。アナリストによるレーティング(買い、中立、売り)がそうですが、そのほかにも2つの要素があります。MFSのリサーチ運用戦略で保有する銘柄に対するアナリストの確信度と、自然言語処理(NLP)を利用してアナリストのリサーチ・ノート(調査メモ)を「読み取り」、センチメントを評価するセンチメント・スコアです。
クオンツ株式リサーチ・チームはこのほど、このセンチメント・スコアについて検討を加え、その結果を踏まえて強化策を実施しました。それまでセンチメントの推定には「Bag-of-Words」モデルというNLPアルゴリズムを用いていました。これは、単語のセンチメントをポジティブまたはネガティブに分類した辞書を参照してテキストにスコアを付けるモデルです。今回アップグレードしたモデルはFinBERTという大規模言語モデルで、文書内のテキストを文脈で理解し、そのセンチメントを定量化する能力がBag-of-Wordsより格段に優れています1。
本稿では、この2つのモデルの概要と機能について解説します。また、アナリストのセンチメントを把握する上でFinBERTのほうが効果的であると考える理由について、MFS独自のアナリスト・ノートの過去の例を用いて説明します。
ブレンデッド・リサーチ運用が以前使用していたBag-of-Wordsモデルは、米ノートルダム大学教授のTim LoughranとBill McDonaldが開発した金融用語辞書を使用したアプローチです。この用語集は、金融文書における通常の使用法に基づき単語をポジティブまたはネガティブにタグ付けします。各ノートに含まれるポジティブまたはネガティブな単語の数を集計することで、ノートのセンチメントを測定します。Loughran/McDonaldの辞書は比較的短い語彙で構成していますが、これはビジネスの場で平易な使い方とは異なる解釈ができる単語の誤分類を避けるためです。例えば、「vice」は大半の辞書ではネガティブな単語とみなされていますが、ビジネスの文脈では「vice president」などでよく使われるため、Loughran/McDonaldの辞書には「vice」は含まれておらず、ニュートラルな単語とみなされています。Bag-of-Wordsによるセンチメント測定の長所は、実装が容易でわかりやすく、どの単語をポジティブまたはネガティブに分類するかをユーザーが管理できることです。一方で欠点は、単純であるがゆえに文脈を理解できず、使用する語彙集に含まれる単語に影響されやすいことです。
Bag of Words | FinBERT |
長所 | |
実装が容易 | 文脈で捉えることができる |
わかりやすい | 金融用語の精通度が高い |
分類を管理できる | センチメント測定の精度が高い |
短所 | |
文脈で捉えることができない | 複雑 |
FinBERTはGoogleが開発したBERT(Bidirectional Encoder Representations from Transformers)モデルをベースにした大規模言語モデル(LLM)で、言語関連のタスクに広く使用されています。テキストメッセージや電子メールで次の単語を予測したり、チャットボットが質問に回答するのを支援する機能があります。FinBERTは、膨大な金融文章の言語資料に基づき微調整が施されており、Malo et al.(2014)のFinancial Phrase Bankデータセットを利用してセンチメントを予測するよう訓練されています2。FinBERTの言語符号化モデルはこの微調整により金融専門用語への精通度が高く、センチメントのレイヤーがポジティブ/ネガティブの測定の仕方を学習します。大規模言語モデルは、複数のニューラルネットワークの「レイヤー」、すなわち、インプットされたテキストを処理してアウトプットする作業を連動して行う一連の計算で構成されています。センチメントのレイヤーは、対象に対する筆者の姿勢を判断する計算プロセスの結果です。
BERTは、言語を符号化し、予測するための言語モデルとして開発され、単語と文章、およびその関係性を表現するよう訓練されています。FinBERTは、平易な英語を理解するBERTの能力を活用し、金融独特のテキストで微調整したセンチメントモデルを作成することで、金融テキストのセンチメントを測定するタスクに重点を置いています。FinBERTの長所は、語彙に左右されず、Bag-of-Wordsでは捉えられない平易なことば、文脈、複雑な関係を理解できることですが、一方で、複雑で、付与されたスコアの理由を正確に理解しづらい点が短所です。FinBERTの開発に関する詳細についてはAraci(2019)をご参照ください3。
FinBERTは大規模言語モデルですが、ChatGPTのような生成モデルではありません。そのため、ChatGPTの安定性に関する問題(例えば非現実的な回答をすることなど)はありません。同じインプットに対しては毎回同じアウトプットを生成します。
この2つのモデルを評価するにあたり、センチメントを効果的に測定する能力と、体系的なクオンツ・ファクターとして使用した場合のスコアに関連する将来のリターンの両方を調べました。FinBERTモデルのリターンはBag-of-Wordsモデルのリターンを上回りましたが、最も重要な違いは、人間がノートを読むのに近い感覚でセンチメントを測定する能力でした
以下は、MFSのアナリストが2016年11月に作成した米国のテクノロジー企業と防衛請負企業に関するリサーチ・ノートの例です。
パラグラフ 1 – 税率を標準化した後の四半期業績は予想通りの水準だった。既存事業の売上高は2%減少したが、減少率は底を打ったようだ。受注は好調で、企業間取引では1.17倍だった。
パラグラフ2 – 利益率の高い戦術無線機の売上を懸念していたが、今四半期は3四半期ぶりに増加し、企業間取引は前四半期の0.92倍に対し1.22倍となった。取引状況は変動的で、全事業につき警戒しているが、これは底を打ちつつあることを示すに足りる。無線機の国外取引は前期比で30%近く増加した。米国の無線機事業は、2018年は常に成長基調にあったが、足元では成長余地はさほど大きくないと思われる。他の事業については今後有機的な成長に向かうと見込んでおり、事業ポートフォリオの再編は続いている。
パラグラフ 3 – 経営陣は引き続きシナジー計画を執行し(利益率は50bp増の13.7%)、一方で事業全体の縮小ペースは急減速している。バリュエーションは2017暦年で17倍と依然妥当に見える。来年にはフリー・キャッシュフローが10億米ドルに達し、株式の利回りは約8%になると見ている。格付けを「買い」に引き上げる。
このノートは当該企業について明らかにポジティブな見方をしており、アナリストは業績見通しは良好であると述べ、格付けを「買い」に引き上げています。FinBERTはこのノートをポジティブと正確に評価しましたが、Bag-of-Wordsモデルではネガティブと評価しています。
FinBERTのスコア | FinBERTのセンチメント | Bag-of-Wordsのスコア | Bag-of-Wordsのセンチメント | |
パラグラフ 1 | -0.58 | ネガティブ | -0.08 | ネガティブ |
パラグラフ 2 | 0.90 | ポジティブ | -0.04 | ネガティブ |
パラグラフ 3 | 0.82 | ポジティブ | -0.05 | ネガティブ |
ノート全体のスコア | 0.38 | ポジティブ | -0.06 | ネガティブ |
FinBERTとBag-of-Wordsは尺度が異なりますが、ともに0を中心に0に近いほどニュートラルとし、正の数値はポジティブなセンチメント、負の数値はネガティブなセンチメントを表します。
両モデルともに、最初のパラグラフについては「既存事業の売上高が減少している」ことからネガティブと捉えていますが、FinBERTモデルはあとの2つのパラグラフについてポジティブと捉えています。一方、Bag-of-Wordsは多くの文章をニュートラルとみなしています。これは、たまたまLoughran/McDonaldの金融用語集にタグ付けされた単語がなかったためですが、これにより、センチメントの重要な指標を見逃す可能性があるということです。例えば、「買い格付けへの引き上げ」、「他の事業は有機的な成長に向かう見込み」、「無線機の国外取引は前期比で30%近く増加」というフレーズは、Bag-of-Wordsではどの単語もタグ付けされていないためニュートラルと見なされます。一方、FinBERTはこれらの文章をすべて正確にポジティブとみなし、このノートではポジティブな内容がネガティブな内容を上回っていることを効果的に捉えています。
Bag-of-Wordsは、スコアリングに使用される語彙への感度が高く、この例のような比較的短いノートの場合、ほとんどの文章をニュートラルと捉えるため、少数の文章がスコアを左右してしまう可能性があります。一方FinBERTは、より人間の感覚に近い形でセンチメントを捉えているようです。この例ではネガティブに捉えられうる単語や文章がいくつか見られますが、ノートの要点は、アナリストが当銘柄についてポジティブな見通しを持っているということです。
分析の一環として、2つのモデルが最も大きく食い違ったノートを調べ、手作業で「ポジティブ」、「ネガティブ」、「ニュートラル」のいずれかにスコア付けしました。分析の結果、FinBERTのスコアは手作業で付けたスコアとの相関が高かっただけでなく、85%の確率で手作業によるポジティブまたはネガティブのスコアと一致しました。
FinBERT Score | Bag-of-Words | |
クオンツ・チームのスコアとの相関 | 0.43 | 0.22 |
一致確率 | 85% | 38% |
FinBERTはより洗練された効果的なセンチメント測定手法ですが、投資に係る優位性はモデルそのものではなく、適用されているデータであることも特筆に値します。MFSではグローバルなファンダメンタルズ・アナリストのチームが銘柄分析を行い、MFSの運用プロフェッショナルのみが利用できるアナリストのノートの独自のデータセットに基づいてセンチメント・スコアを算定しています。FinBERTのような高度なツールを活用して独自のデータセットを分析することで、MFSのファンダメンタルズ・チームが導き出した洞察に基づく、他に峻別するアルファ・シグナルを捉えることができると考えます。
巻末脚注
1 センチメントとは、自然言語処理モデルによる人間のようなテキストの理解を指します。MFSブレンデッドリサーチ・クオンツ・アルファ・モデルで使用されるセンチメント・ファクターとは異なります。
2 Malo, P., Sinha, A., Korhonen, P., Wallenius, J. and Takala, P. (2014), Good Debt or Bad Debt. J Assn Inf Sci Tec, 65: 782-796. https://doi.org/10.1002/asi.23062.
3 D. Araci, “Finbert: Financial sentiment analysis with pre-trained language models,” arXiv preprint arXiv:1908.10063, 2019.
当レポートの中の意見は執筆者個人のものであり、予告なく変更されることがあります。また意見は情報提供のみを目的としたもので、特定証券の購入、勧誘、投資助言を意図したものではありません。予想は将来の成果を保証するものではありません。
MFSの投資分析、クオンツモデルの開発および利用、投資先の選択は、意図した結果をもたらすとは限らず、また、類似の運用戦略のポートフォリオや、ポートフォリオが投資する市場をアンダーパフォームする結果につながる可能性があります。MFSが利用する自社開発または第三者開発のクオンツモデルは、適用するファクター、各ファクターのウェイト付け、市場リターンの源泉の変化、市場ファクターの過去のトレンドからの変化、モデルの開発・適用・維持におけるテクニカルイシュー(不完全または不正確なデータ、プログラミング/ソフトウェアの問題、コーディングエラー、技術的欠陥など)など様々な理由により、意図した成果を提供できないことがあります。