dahara1

ビッグデータ

データ拡張を教師なしで実現し半教師付き学習の性能を向上(2/2)

1.データ拡張を教師なしで実現し半教師付き学習の性能を向上(2/2)まとめ ・UDA、教師なしデータ拡張を使うと半教師付き学習が教師付き学習を上回る性能を出すようになる ・拡張元となるラベル付きデータが少なくとも多くとも教師付き学習の最先端...
入門/解説

データ拡張を教師なしで実現し半教師付き学習の性能を向上(1/2)

1.データ拡張を教師なしで実現し半教師付き学習の性能を向上(1/2)まとめ ・ラベル付きデータが不足している際にデータを水増しする手法は進歩している ・しかし、基本的には教師付き学習でのみ利用可能な手法であった ・今回、ラベルなしデータを教...
学習手法

データサイエンス学習時にやりがちな3つの大きな間違い(3/3)

1.データサイエンス学習時にやりがちな3つの大きな間違い(3/3)まとめ ・データサイエンスは共同作業の側面もあるため共に学ぶ仲間を見つけよう ・フォーラム、チャット、ディスカッション掲示板など沢山の人と学べば学習は簡単になる ・チートシー...
入門/解説

ディープニューラルネットワークにおける一般化ギャップの予測(2/2)

1.ディープニューラルネットワークにおける一般化ギャップの予測(2/2)まとめ ・一般化ギャップと対数変換したマージン分布の統計的情報はほぼ完全に線形回帰式で表現可能 ・マージン分布にモデルの一般化度合いに関する重要な情報が含まれている可能...
入門/解説

ディープニューラルネットワークにおける一般化ギャップの予測(1/2)

1.ディープニューラルネットワークにおける一般化ギャップの予測(1/2)まとめ ・トレーニング時に出てこなかった初見のデータに対応する能力を一般化と言う ・一般化ギャップとは「トレーニングデータ」と「初見データ」に対するパフォーマンスのギャ...
学習手法

データサイエンス学習時にやりがちな3つの大きな間違い(2/3)

1.データサイエンス学習時にやりがちな3つの大きな間違い(2/3)まとめ ・データサイエンスの習得には座って授業を聞くだけでなく実践する事が大切つ ・モデリングは非常に大切でその意義や目的を理解して作る必要がある ・Youtubeの動画やS...
入門/解説

データサイエンス学習時にやりがちな3つの大きな間違い(1/3)

1.データサイエンス学習時にやりがちな3つの大きな間違い(1/3)まとめ ・データサイエンスは実務的な使われ方が優先される傾向があるが科学としての側面を持つ ・この前提に基づかないと適切にデータサイエンスを実践する事が非常に困難になる ・全...
入門/解説

Gen:新しいAI用プログラミング言語はディープラーニングを超える(2/2)

1.Gen:新しいAI用プログラミング言語はディープラーニングを超える(2/2)まとめ ・確率的プログラミングは、AIの新たなフロンティアとして有望視されている分野の1つ ・Genは確率的プラグラムの使用を容易にするため、問題に対して原理的...
入門/解説

Gen:新しいAI用プログラミング言語はディープラーニングを超える(1/2)

1.Gen:新しいAI用プログラミング言語はディープラーニングを超える(1/2)まとめ ・Genと言うjuliaベースの新しいプログラミング言語をMITが新たに開発 ・ディープラーニング以外の各種AIテクノロジーも部品として利用可能で効率的...
入門/解説

時系列予測に機械学習を使用する際の落とし穴(3/3)

1.予測に機械学習を使用する際の落とし穴(3/3)まとめ ・誤った精度測定基準を選択すると実際には予測できないデータも高い精度で予測できているように見える ・時系列データは時間的に相関する傾向があり、直前の値を予測値とする事で見かけ上は高い...
入門/解説

時系列予測に機械学習を使用する際の落とし穴(2/3)

1.予測に機械学習を使用する際の落とし穴(2/3)まとめ ・誤った精度測定基準を選択すると実際には予測できないデータも高い精度で予測できているように見える ・時系列データは時間的に相関する傾向があり、直前の値を予測値とする事で見かけ上は高い...
入門/解説

時系列予測に機械学習を使用する際の落とし穴(1/3)

1.時系列予測に機械学習を使用する際の落とし穴(1/3)まとめ ・時系列データは様々な分野で扱う事が多いデータで機械学習でも取り扱い方をしっておくべき重要なデータ ・しかし、時間成分によて追加情報がもたらされるが、他の予測タスクより処理する...