1.市場データとニュースを並べて時系列分析(1/2)まとめ
・ニュースが市場に与える影響は長年にわたって強い関心を集めてきた分野
・金融とニュースのデータを調査し、参照するのに役立つ一連のツールの紹介
・時系列分析にはMetaのKatsライブラリが季節性の分解や予測に役立つ
2.時系列分析用ツールやテクニックの紹介
以下、www.kdnuggets.comより「Market Data and News: A Time Series Analysis」の意訳です。元記事は2022年6月24日、Parsa Ghaffariさんによる投稿です。
元記事内に出てくるNews取得APIの提供会社の方が書いた記事なのですが、個人的に興味があったのと関連するツールについて簡単に概要を説明してくれているので勉強になるなと思って意訳しました。
アイキャッチ画像のクレジットはPhoto by Oren Elbaz on Unsplash
要約
この記事では、株式市場とニュースの関係を研究するためのいくつかのツールやテクニックを紹介します。時系列処理アノマリー検出、そしてイベントベースのニュースの見方について探求しています。また、これらのコンセプトのいくつかを実証するために直感的なチャートを作成し、これらすべての背後にあるコードをノートブックで共有します。
はじめに
ニュースが市場に与える影響は長年にわたって強い関心を集めてきた分野であり、定量分析の登場により、学術界から計量アナリストまで多くの人がニュースと株価や取引量などの市場データとの関係をより良く理解するために統計的手法を使用してきました。
本稿では、より深く、より的を射た分析を行うための基礎として、ニュースデータと市場との統計的関係を探るためのシンプルな実用ガイドを提供することを目的としています。私達の目標は、読者が金融とニュースのデータを調査し、相互参照するのに役立つ一連のツールを提供することです。私たちの目標は、株式市場を予測することでも、特定の相関関係や因果関係を発見することでもありません。
市場データとニュースを整列する
ニュースと市場データの関係を調べるために、まずAylienのニュースAPIを活用します。このAPIでは、ユーザーはリアルタイムと履歴の両方の世界のニュースデータを、包括的なフィルターセットを使用してフィルタリングすることができます。これらのフィルターを用いて、関心のある証券(株式、ETF、暗号資産など)に対応するニュースフィードを作成します。次に、ヤフーファイナンスを使って、これらの有価証券の市場データ(価格と出来高)を取得します。この2つを組み合わせることで、任意の証券について、任意の時間枠で、市場データとニュース関連データの両方からなる共同データセットを構築することができます。
以下の表は、さまざまな種類の金融機関に対応するニュース API フィルタをまとめたものです。
また、News APIに用意されている情報元や地理要因などのフィルタリングオプションを利用して、ニュースフィードをさらに絞り込むことも可能であり、タスクに応じて使い分けるとよいでしょう。
この記事では主に市場の価格と出来高のデータを使用していますが、この記事で探求するテクニックの多くは他のタイプの金融や経済データに拡張可能であることを述べておきます。例えば、解雇とニュースの関係を研究するために、統計局から過去の解雇データを取得し、News API のイベントフィルターを使ってそれらをニュースに合わせる(例えば、明確に解雇や労働関連の発表に関するニュース記事を取得する)ことが可能です。
いくつかの基本的な例
整列の概念をよりよく示すために、いくつかの基本的な例を見てみましょう。ここでは、AppleとTeslaという2つのテクノロジー企業と、テクノロジーセクターETFであるXLK、そして最後にS&Pインデックス(GSPC)について学びます。それぞれの企業について、2021年4月1日から2022年4月1日までの1年間のニュースおよび市場データを取得し、1つのチャートにグラフ化してみます。マーケットとニュースのデータには、多くのパラメータが用意されています。
例1. Apple Inc (AAPL)のニュース量、センチメント、株価、取引量
例2.Tesla Inc (TSLA)のニュース量、センチメント、株価、取引量
例3.テクノロジーセクターETF(XLK)のニュース量、センチメント、株価、取引量
これは、様々な時系列間の動きを視覚的に比較する手軽な方法です。次の章では、因果関係や相関関係を調べるステップとして、これらの時系列上の興味深い点を見つけ、より具体的に比較する方法について見ていきます。
時系列分析
これまで、ニュース(記事数、センチメント)とマーケット(株価、取引量)の属性を反映した時系列データを整列して取得しました。これらの時系列をさらに分解して理解するために、いくつかの時系列分析手法を採用します。MetaのKatsライブラリを使用します。これは様々な時系列分析ツールを提供します。
1. 前処理
まず、時系列に起こったトレンドと季節性を識別し、正規化するために、時系列を分解することから始めましょう。各時系列にKatsの分解ユーティリティを “additive” モードで適用します。
例4. Apple Inc (AAPL)のニュースボリューム時系列をトレンド、季節性、残差に分解した場合
2. 予測
Katsパッケージのもう一つの有用なユーティリティは、予測モジュールです。Katsは、SARIMA、Prophet(Metaによる予測ライブラリ)、Holt-Winters、アンサンブル予測モデルなど、様々な時系列予測手法をサポートしています。これらの手法にはそれぞれ長所と短所があり、与えられた時系列に対して最適に動作させるためには、パラメータのチューニングが必要です。Kats予測モジュールの詳細はgithubでご覧いただけます。
ここでは、時系列分析の手法として予測を紹介していることに注意してください。私たちの目的は、将来のニュース量や株価を予測することではありません。
例5. Holt-Wintersを用いたApple Inc (AAPL)のニュース記事量の1ヶ月予測
3. チェンジポイント検出
チェンジポイント検出は、確率過程や時系列の確率分布が変化した時(例えば時系列の平均が変化した時)を識別しようとするものです。これは時系列分析において最も一般的な検出タスクの1つです。予測同様、Katsは様々なチェンジポイント検出モデルをサポートしています。これらは以下の通りです。
CUSUM:時系列中の平均のアップ/ダウンシフトを検出する方法
ベイズオンラインチェンジポイント検出(BOCPD): 時系列中の突然の変化を検出する手法で、時間とともに持続します。
RobustStatDetector: CUSUMと同様に、時系列データの平均値のシフトを発見する変化点検出アルゴリズムです。
この概念をよりよく示すために、Appleに関するニュースの報道における突然のジャンプを特定するために、Appleのニュース量の時系列にBOCPDを適用してみます。
例6. ベイズオンライン変化点検出(BOCPD:Bayesian Online Change Point Detection)をApple Inc (AAPL)に関するニュース記事のボリュームに適用
3.市場データとニュースを並べて時系列分析(1/2)関連リンク
1)www.kdnuggets.com
Market Data and News: A Time Series Analysis
2)colab.research.google.com
Exploring relationships between news and market data using time series analysis
3)github.com
facebookresearch/Kats