ビッグデータ

1/6ページ

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(6/6)

  • 2019.08.18

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(6/6)まとめ ・GWASkbの作成に使用されたシステムは、Snorkel IEフレームワークの上にPythonで実装されている ・本システムは少数の誤検出を発生させるため、全て自動抽出結果を検証することが推奨される ・GWASkbで報告された6422の関係性の合計精度は78 – 94%と推定される 2.Snorkelによる […]

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(5/6)

  • 2019.08.17

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(5/6)まとめ ・新規にGWASkbに収集された多様体の効果量は他と比較して大きかった ・非構造化テキストから構造化関係を抽出することは、情報抽出システムの主題 ・機械による情報抽出は今後の研究やキューレーションを加速させるポテンシャルを持つ 2.GWASkbと他のGWAS関連データベースとの比較 以下、www.nature.comより […]

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(4/6)

  • 2019.08.16

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(4/6)まとめ ・GWASkbは多くのアプリケーションに有用なレベルで手動キュレーションDBに掲載された8割を自動収集 ・GWASkb手動キュレーションDBに掲載されていないが有用であると思われる多様体も収集できていた ・多様体を外部ツールによる注釈と比較した所、有意に一致しており外部ツールによる検証もクリア 2.GWASkbと他のGW […]

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(3/6)

  • 2019.08.15

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(3/6)まとめ ・GWASkbは十分に高い精度を維持しながら、既存の文書からかなりの数の関連性を抽出 ・人間がキュレーションしたデータベースとは採用基準が異なるが他に掲載されていない関連性も抽出できた ・検証の結果GWASkbは、手動でキュレーションされた関連性の最大80%をカバーしている 2.GWASkbと他のGWAS関連データベース […]

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(2/6)

  • 2019.08.14

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(2/6)まとめ ・GWASkbは遺伝的多様体、表現型、およびp値を自動的に収集する ・構文解析、候補生成、候補分類の3段階を経て文書から関係性を抽出 ・スタンフォードCoreNLPパイプラインやSnorkelを使って実現している 2.GWASkbの情報抽出方法 以下、www.nature.comより「A machine-compiled […]

GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(1/6)

  • 2019.08.13

1.GWASkb:ゲノムワイド関連解析情報を論文から自動抽出(1/6)まとめ ・過去に発見された遺伝子情報の中にはデータベースで利用可能な状態になっていない情報もある ・これらの情報は膨大なドキュメントの中に埋もれてしまっており人力での抽出が困難になっている ・GWASkbはデータプログラミングを使って出版物から有用な情報を抽出できるかを挑戦した研究 2.GWASkbとは? 以下、www.natu […]

アメリカのデータサイエンス求人レポート2019(2/2)

  • 2019.07.25

1.アメリカのデータサイエンス求人レポート2019(2/2)まとめ ・2年前と比べて250%以上の求人数の伸びを示したのはTensorflow、Apache Flink、Alteryx ・次に伸びているのはH2O、Caffe、Python、Tableauなどが100%前後の伸び率 ・第3グループとして伸びているのはJulia、Apache Spark、Scala、Rが50%前後の伸び率 2.アメリ […]

アメリカのデータサイエンス求人レポート2019(1/2)

  • 2019.07.24

1.アメリカのデータサイエンス求人レポート2019(1/2)まとめ ・アメリカのデータサイエンス求人でスキル要件として上げられる事の多いソフトウェアのランキング ・求人情報件数で比較するとRの求人はPythonの求人の約半数となっている ・またRと良く比較される事の多いSASの求人件数はRの6割程度となっている 2.アメリカのデータサイエンス求人市場でニーズが高いソフトウェアスキル 以下、www. […]

データサイエンス学習時にやりがちな3つの大きな間違い(3/3)

  • 2019.07.13

1.データサイエンス学習時にやりがちな3つの大きな間違い(3/3)まとめ ・データサイエンスは共同作業の側面もあるため共に学ぶ仲間を見つけよう ・フォーラム、チャット、ディスカッション掲示板など沢山の人と学べば学習は簡単になる ・チートシートを使うと時間を節約する事が出来るので積極的に取り込もう 2.データサイエンスは共同作業 以下、www.kdnuggets.comより「The 3 Bigges […]

データサイエンス学習時にやりがちな3つの大きな間違い(2/3)

  • 2019.07.10

1.データサイエンス学習時にやりがちな3つの大きな間違い(2/3)まとめ ・データサイエンスの習得には座って授業を聞くだけでなく実践する事が大切つ ・モデリングは非常に大切でその意義や目的を理解して作る必要がある ・Youtubeの動画やScikit-Learnのようなライブラリの文書に目を通す事も望ましい 2.データサイエンス学習の際の注意点 以下、www.kdnuggets.comより「The […]

1 6