調査/研究

入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)まとめ ・WindowsAPIを使ってExcelを起動してExcel内のグラフを画像として保存する方法 ・pywin32(win32com.client)...
入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)まとめ ・Pythonを使ってWindowsもExcelもない環境でExcelファイルを新規に作成/編集可能 ・openpyxlを使うとExcel内のセル...
入門/解説

PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(2/2)

1.PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(2/2)まとめ ・joblibを使用するとファイルを並列で読み込み速度アップできる ・pickle形式でファイルを保存するとCSVより更に高速になる ・jobli...
入門/解説

PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(1/2)

1.PythonでExcelの巨大ファイルを扱う際に1000倍高速化する方法(1/2)まとめ ・ビジネスではExcelでファイルが共有される事が多いがPythonはExcelファイルでは特に低速 ・Excelファイルを保存する際にCSVで保...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(3/3)まとめ ・複数の方法/ツール、アウトソース先を組み合わせて最適なやり方を探る事が重要 ・反復的なアプローチを採用し、量より質を優先した多様性のあるラ...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(2/3)まとめ ・データに注釈/ラベルを付ける作業は労力がかかるが第三者にアウトソーシングするのも困難 ・会ったことのない完全に見知らぬ人に作業内容を一から...
入門/解説

Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)

1.Agile Data Labeling:それが何であり、なぜそれが必要なのか?(1/3)まとめ ・変化への対応を是とするアジャイル型開発手法はソフトウェア開発に生産性革命をもたらした ・MLプロジェクトにとってデータ整備は重要だが生産性...
入門/解説

データサイエンティストと機械学習エンジニアの違い

1.データサイエンティストと機械学習エンジニアの違いまとめ ・データサイエンティストと機械学習エンジニアの違いは明確になっていない事が多い ・データサイエンティストはデータをよりよく理解し、モデルのプロトタイプを作成する ・機械学習エンジニ...
入門/解説

最先端の研究を追い続けるための工夫

1.最先端の研究を追い続けるための工夫まとめ ・個々の論文ではなく分野を前進させているキーパーソンや広範なレビュー論文に注目する ・全てに目を通すのではなく目的をもって要所だけ確認し、要点を自分なりに整理する ・Zettelkasten(ツ...
ビッグデータ

アフリカ大陸の多種多様な建物を衛星画像から検出(2/2)

1.アフリカ大陸の多種多様な建物を衛星画像から検出(2/2)まとめ ・精度の向上にはmixupとNoisyStudent、及びガウス畳み込みに基づいた境界明確化が貢献 ・地域差はあるがアフリカ大陸に存在する建物の大きさとその数(5億1600...
ビッグデータ

アフリカ大陸の多種多様な建物を衛星画像から検出(1/2)

1.アフリカ大陸の多種多様な建物を衛星画像から検出(1/2)まとめ ・建物面積は人口推定や都市計画、人道的対応や環境科学まで様々な分野に応用できるので重要 ・国勢調査情報がない地域もあるアフリカで衛星画像から建物分布を調査する研究を行った ...
ビッグデータ

デルタ変異株ではおそらく集団免疫は獲得できない

1.デルタ変異株ではおそらく集団免疫は獲得できないまとめ ・感染力が2.5倍高いデルタ株では集団免疫が獲得できるとされていた接種率では不十分になる ・ヨーロッパや米国ではワクチンをブースター接種して強化する事が議論されている ・デルタ変異株...