ビッグデータ

1/2ページ

なぜ我々はロシアによる3百万のTwitter攻撃を共有したのか?

  • 2018.08.13

1.なぜ我々はロシアによる3百万のTwitter攻撃を共有したのか?まとめ ・アメリカ大統領選挙の前後にロシア資本の会社が大量のTweetをしていた ・fivethirtyeightが300万のロシアツイートを誰でも利用できるように公開 ・大統領選挙前より選挙後の方がトータルのつぶやき数が多かったと言う 2.ロシアによるアメリカ大統領選挙時のTwitter攻撃 以下、fivethirtyeight […]

データサイエンティストのためのRパッケージランキング2018年版

  • 2018.08.12

1.データサイエンティストのためのRパッケージランキング2018年版まとめ ・データ操作、視覚化、機械学習のためのRライブラリンキング ・github上の活動状況などを元に集計したランキング ・他にも優れたパッケージはあるのでR Documentationなどで検索すると良いかも 2.データサイエンティストのためのRライブラリTOP20(2018) 以下、kdnuggets.comに転載されていた […]

Google BigQuery上で機械学習を動かす

  • 2018.08.01

1.Google BigQuery上で機械学習を動かすまとめ ・ビッグデータを高速に操作できるクラウドサービスGoogle BigQuery上で機械学習が実行可能に ・SQLを扱った人なら比較的容易に使いこなす事ができそうな使い勝手 ・将来的にBigQuery MLには予測以外にも様々な機能が追加される予定 2.Google BigQuery上の機械学習とは? 以下、ai.googleblog.c […]

三菱UFJ信託の個人データ銀行

  • 2018.07.25

1.三菱UFJ信託の個人データ銀行まとめ ・信託銀行大手の「三菱UFJ信託銀行」が個人情報銀行を来年度中にも参入予定 ・スマホアプリを使って個人に健康診断や月々の支出などデータを登録して貰う ・個人から同意を得て預かった個人情報データを企業に提供する 2.データを本当に活用するために必要な事 三菱UFJ信託銀行は18日、購買履歴などの個人データを管理し、企業など第三者に販売する「情報銀行」の事業を […]

柔軟で効果的なプレゼンテーションが出来る無料のデータ視覚化ツール5つ

  • 2018.07.20

1.柔軟で効果的なプレゼンテーションが出来る無料のデータ視覚化ツール5つまとめ ・無料で人気の高いデータ可視化ツール5つの紹介 ・Rベースのもの、JavaScriptベースのもの、SQLに操作感が似ているもの、知識なしでも使えるもの ・無料と言えどもビジネスユースでも多く使われておりサンプルを見ているだけで飽きない 2.無料のデータ可視化ツールまとめ 以下、www.kdnuggets.comの「5 […]

2018年に貴方が雇用される事になるかもしれない5つのデータサイエ ンスプロジェクト

  • 2018.07.12

1.2018年に貴方が雇用される事になるかもしれない5つのデータサイエンスプロジェクトまとめ ・自分が出来る事をアピールするためにポートフォリオを作成する ・データサイエンティストのポートフォリオは5つの種類がある ・勉強のための勉強ではなくビジネス視点で構築する事が大事 2.データサイエンスの職を得るための最良の方法とは? ポートフォリオ作成は、データサイエンス業界に入るための最良の方法です。こ […]

量子コンピューターの動作原理を理解する

  • 2018.07.04

1.量子コンピューターの動作原理を理解するまとめ ・専門家が素人に量子コンピューターを説明する動画をWiredが公開 ・残念ながらそれでも難しく感じたので自分なりに解釈した説明を書いてみる ・量子の2つの性質をありのままに受け入れる事が概念理解の早道 2.量子コンピューターを理解するために必要な知識 Wiredが専門家が子供から研究者まで幅広い知識レベルの人に量子コンピューターを説明する動画を公開 […]

データサイエンティストがJupyter notebookを愛する10の理由

  • 2018.06.25

1.データサイエンティストがJupyter notebookを愛する10の理由まとめ ・PythonやR、Juliaを気軽に試せるJupyter notebookの紹介 ・気軽に試せる、一つにまとめられる、先達の結果を借りれると本当のノートのごとき使い勝手 ・PythonやR、Juliaを試してみたいと考えている人はまずはJupyter notebooksで試すと良いかも 2.Jupyter no […]

PythonでPDFからjpeg画像を抽出する方法

  • 2018.04.29

0.English sample Extract jpeg from PDF using Python. https://github.com/patch0000/Python3-PDF2TXT-sample 1.PythonでPDFからjpeg画像を抽出する方法まとめ ・PythonでPDFからjpeg画像を抽出するサンプルコードの紹介 ・jpeg以外の画像はpdfminerが非対応 ・PDFの […]

巨大データを効率よく分割するアフィニティ クラスタリング

  • 2018.03.26

1.巨大データを効率よく分割するアフィニティ クラスタリングまとめ ・Googleが新しいクラスタリング手法の実績を公開 ・アフィニティクラスタリングをベースとした手法で巨大データを効率よく分割 ・GoogleMapのデータベースアクセス効率を大きく向上させた 2.アフィニティ クラスタリングとは? 巨大で複雑なデータを効率良く扱うためには、データを分割すると良い。しかし、巨大データを同じくらいの […]