ビッグデータ

YouTube-8Mセグメントデータセットの発表

1.YouTube-8Mセグメントデータセットの発表まとめ ・従来のYouTube-8Mデータセットは機械的に付与したラベルと同程度の品質のビデオレベルラベルであった ・YouTube-8Mセグメントデータは人間が目で付与した時間的に特定さ...
入門/解説

機械学習を使ってバスの運行情報を予測(3/3)

1.機械学習を使ってバスの運行情報を予測(3/3)まとめ ・曜日や時刻などの時間的特徴表現を使うと予測の元データの車の速度が一定でも遅延が明確になる ・全てを取り入れた運行予測はまだ完全ではないが現実のバスの運行時間と1.5分以内のズレに留...
入門/解説

機械学習を使ってバスの運行情報を予測(2/3)

1.機械学習を使ってバスの運行情報を予測(2/3)まとめ ・バスの運行情報を予測する際には地域特性や時間帯の特性も考慮されている ・都会と田舎、左側交通と右側交通、バス専用レーンの存在なども運行予測の際に考慮される ・曜日と時刻、ラッシュア...
入門/解説

機械学習を使ってバスの運行情報を予測(1/3)

1.機械学習を使ってバスの運行情報を予測(1/3)まとめ ・GoogleMapにバスの運行情報を予測する機能が搭載された ・従来の経路案内もリアルタイム交通情報が提供されていると考慮していた ・今回のバスの運行予測は交通情報が提供されていな...
学習手法

グラフデータを機械学習で扱いやすくするための革新(3/3)

1.グラフデータを機械学習で扱いやすくするための革新(3/3)まとめ ・グラフのembedding手法は有用であるが手動で設定しなければならない多数のハイパーパラメータを持つ ・第二の論文で紹介している「Watch Your Step」はハ...
モデル

グラフデータを機械学習で扱いやすくするための革新(2/3)

1.グラフデータを機械学習で扱いやすくするための革新(2/3)まとめ ・従来のほとんどの手法は各ノードに対して単一のembeddingが学習されなければならないと仮定している ・現実のネットワークは複数の重複するコミュニティと複数の役割が同...
モデル

グラフデータを機械学習で扱いやすくするための革新(1/3)

1.グラフデータを機械学習で扱いやすくするための革新(1/3)まとめ ・グラフはノード(頂点)とエッジ(辺)で構成され概念間の関係を表す事が出来る ・しかしグラフは離散的データであり機械学習が好む連続的データではない ・グラフを機械学習で良...
入門/解説

数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(3/3)

1.数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(3/3) ・数学的プログラミングの本質は数学的性質やパターンをプログラムでテストする事 ・この習慣は次世代のデータサイエンティストのためのグッドプラクティスの開発に...
入門/解説

数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(2/3)

1.数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(2/3) ・ランダムダーツ投げのような検証は多数の試行が行われるという条件下でのみ有効 ・他のモンテカルロ実験と同様に投げた回数が多いほど近似は良くなる ・科学的実...
入門/解説

数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(1/3)

1.数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(1/3)まとめ ・数学的プログラミングとは一連の計算タスクを含む数学的概念をコード化する習慣を身につける事 ・これを見に付けると発見した数学的特性やアイデアを簡単な...
モデル

Off-Policy Classification:強化学習モデルを選別する新手法(2/2)

1.Off-Policy Classification:強化学習モデルを選別する新手法(2/2)まとめ ・OPCはSim-to-Realテクニックによって訓練されたモデルの評価に対しても有効であった ・OPCのスコアと現実世界のタスクの成功...
モデル

Off-Policy Classification:強化学習モデルを選別する新手法(1/2)

1.Off-Policy Classification:強化学習モデルを選別する新手法(1/2)まとめ ・完全ポリシー外強化学習は過去に収集されたデータのみを使って学習するタイプの強化学習 ・物理的なロボットがなくてもモデルをトレーニングが...