モデル

CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(1/2)

1.CoAtNets:畳み込みと自己注意の利点を備えたハイブリッドモデル(1/2)まとめ ・モデルとデータサイズが大きくなるにつれてトレーニング効率が重要な焦点になりつつある ・ニューラルアーキテクチャ探索を活用して画像認識用のモデルを2種...
基礎理論

評価が難しい作業を実行するAIを人間が評価しやすくする工夫

1.評価が難しい作業を実行するAIを人間が評価しやすくする工夫まとめ ・AIが意図しなかった動作をしてしまう事は合致問題(alignment problem)として知られる ・合致問題は「モデルの出力を人間が評価する事が困難または時間がかか...
入門/解説

Google Colabで日本語を含むPDFファイルを作成する方法

1.Google Colabで日本語を含むPDFファイルを作成する方法まとめ ・Google Colabで日本語を含むPDFを作成するためのサンプルコードの紹介 ・PDFはFPDF for Pythonというパッケージを使えば簡単に作成する...
入門/解説

Google Colabのmatplotlibでグラフ内に日本語を使う方法

1.Google Colabのmatplotlibでグラフ内に日本語を使う方法まとめ ・Google Colabのmatplotのグラフで日本語を表示させるためのサンプルコードの紹介 ・matplotはフォントのキャッシュファイルを暗黙のう...
モデル

Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(2/2)

1.Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(2/2)まとめ ・典型的なmask R-CNNの実装は完全教師有り設定ではパフォーマンスに影響を与えなかった ・部分的教師有り設定ではcropping-to-ground...
モデル

Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(1/2)

1.Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(1/2)まとめ ・境界ボックス形式ではなくマスク形式のラベルを作成する際に性能が低下する要因を特定 ・一部のみがマスク形式ラベルを持つ部分的教師あり設定でも高パフォーマン...
モデル

AI Choreographer:音楽に合わせたダンスを生成する人工知能(2/2)

1.AI Choreographer:音楽に合わせたダンスを生成する人工知能(2/2)まとめ ・FACTはMotion、Audio、Cross-Modalの3種のTransformerから構成される ・full-attention mask...
モデル

AI Choreographer:音楽に合わせたダンスを生成する人工知能(1/2)

1.AI Choreographer:音楽に合わせたダンスを生成する人工知能(1/2)まとめ ・機械学習でダンスを生成するには動きと音楽を考慮して連続モーションを生成する能力が必要 ・既存のAISTダンスデータセットに3D情報を付与してAI...
入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(3/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(3/3)まとめ ・Wordファイルのひな型に画像とExcelから抽出を使ってデータを挿入してレポートを作成 ・動作させるためにはWordファイルのひな型と画像が必...
入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(2/3)まとめ ・WindowsAPIを使ってExcelを起動してExcel内のグラフを画像として保存する方法 ・pywin32(win32com.client)...
入門/解説

Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)

1.Pythonを使用してMicrosoft ExcelとWordを自動連係(1/3)まとめ ・Pythonを使ってWindowsもExcelもない環境でExcelファイルを新規に作成/編集可能 ・openpyxlを使うとExcel内のセル...
データセット

発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(2/2)

1.発声に困難を抱える人の音声コミュニケーションを支援するモデル用のデータセットの開発(2/2)まとめ ・全体的にパーソナライズ手法は全重症度レベルと条件にわたって大幅な改善をもたらした ・個人向けに最適化されたASRモデルの単語誤り率は人...