入門/解説

入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)まとめ ・WindowsAPIを使ってExcelを起動してExcel内のグラフを画像として保存する方法 ・pywin32(win32com.client)...
入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)まとめ ・Pythonを使ってWindowsもExcelもない環境でExcelファイルを新規に作成/編集可能 ・openpyxlを使うとExcel内のセル...
入門/解説

PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(2/2)

1.PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(2/2)まとめ ・joblibを使用するとファイルを並列で読み込み速度アップできる ・pickle形式でファイルを保存するとCSVより更に高速になる ・jobli...
入門/解説

PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(1/2)

1.PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(1/2)まとめ ・ビジネスではExcelでファイルが共有される事が多いがPythonはExcelファイルでは特に低速 ・Excelファイルを保存する際にCSVで保...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)まとめ ・複数の方法/ツール、アウトソース先を組み合わせて最適なやり方を探る事が重要 ・反復的なアプローチを採用し、量より質を優先した多様性のあるラ...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)まとめ ・データに注釈/ラベルを付ける作業は労力がかかるが第三者にアウトソーシングするのも困難 ・会ったことのない完全に見知らぬ人に作業内容を一から...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)まとめ ・変化への対応を是とするアジャイル型開発手法はソフトウェア開発に生産性革命をもたらした ・MLプロジェクトにとってデータ整備は重要だが生産性...
入門/解説

データサイエンティストと機械学習エンジニアの違い

1.データサイエンティストと機械学習エンジニアの違いまとめ ・データサイエンティストと機械学習エンジニアの違いは明確になっていない事が多い ・データサイエンティストはデータをよりよく理解し、モデルのプロトタイプを作成する ・機械学習エンジニ...
入門/解説

最先端の研究を追い続けるための工夫

1.最先端の研究を追い続けるための工夫まとめ ・個々の論文ではなく分野を前進させているキーパーソンや広範なレビュー論文に注目する ・全てに目を通すのではなく目的をもって要所だけ確認し、要点を自分なりに整理する ・Zettelkasten(ツ...
入門/解説

データサイエンティストとしてPythonコードを再利用可能な形式で管理する方法

1.データサイエンティストとしてPythonコードを再利用可能な形式で管理する方法まとめ ・gitを使うまでもないような小規模なプロジェクトでコードを管理する際の初心者用tips ・大規模開発では推奨されない事もあるやり方だが必要になるケー...
入門/解説

マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(2/2)

1.マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(2/2)まとめ ・問題解決に関しては創造性を発揮し、新しい解決策を提案することを恐れない事 ・モデルを構築したり分析を実行したりするときは、常にビジネスへの影...
入門/解説

マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(1/2)

1.マッキンゼーで教わった優れたデータサイエンティストになるための5つのレッスン(1/2)まとめ ・最高のパフォーマンスを発揮するデータサイエンティストは分析以外にソフトスキルを持つ ・最初に重要なメッセージを伝えて、次に重要なメッセージに...