ロボット ロボットが地形を見て適切な歩き方を選択できるようになる(2/2) 1.ロボットが地形を見て適切な歩き方を選択できるようになる(2/2)まとめ ・最初にセマンティックセグメンテーションモデルを学習させる事で学習を効率化 ・速度ポリシーからの指令に基づいて歩行スタイルを計算するようにした ・登山同を従来手法よ... 2022.09.15 ロボット学習手法
モデル MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(2/2) 1.MaxViTとMAXIM:ViTの効率を更に高めた視覚タスク用新モデル(2/2)まとめ ・MAXIMは低レベルの画像間予測タスクのために調整されたUNetに似たアーキテクチャ ・画像サイズが大きくなっても計算量は線形に増えるだけなので高... 2022.09.12 モデル
画像生成 Stable Diffusionを使ってシシ神様をトトロに差し替える 1.Stable Diffusionを使ってシシ神様をトトロに差し替えるまとめ ・人工知能に絵の中の指定する一部分だけを差し替えて貰う機能がin-painting ・絵の範囲外の部分を補完して描いてくれるout-paintingと言う機能も... 2022.09.04 画像生成
画像生成 人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編) 1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編) ・DALL·E miniの開発者の人が提供してくれているCraiyonにナウシカを描いて貰う試み ・Craiyonは人間の顔の表現がまだ苦手だがナ... 2022.08.16 画像生成
アプリケーション DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2) 1.DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2)まとめ ・DALL·E Flowは幾つかのモデルを連携させてDALL·Eの性能や表現力を底上げする試み ・DALL·E と拡散モデルとSwinIR... 2022.06.13 アプリケーション画像生成
モデル LiT:画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(2/2) 1.LiT:画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(2/2)まとめ ・転移学習は精度は高いがタスク毎に手間がかかり対照学習はその逆で性能面に難があった ・LiTは画像エンコーダの学習をロックする事でこの性能ギャップを半... 2022.05.04 モデル
アプリケーション DALL·E 2:言葉による指示を理解してリアルな画像や芸術作品を作り出す人工知能 1.DALL·E 2:言葉による指示を理解してリアルな画像や芸術作品を作り出す人工知能まとめ ・昨年発表されたDALL·E言語解釈能力と生成画像の品質を更に高めたDALL·E 2が発表された ・DALL·Eの画像は少し稚拙な画像もあったがD... 2022.04.07 アプリケーション画像生成
ロボット XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2) 1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高... 2022.02.16 ロボット学習手法
アプリケーション 毛先まで明瞭に自撮りできるPixel 6のポートレートモード(1/2) 1.毛先まで明瞭に自撮りできるPixel 6のポートレートモード(1/2)まとめ ・従来のマスク手法は画素が前景に属するか背景に属するかをYes or Noの2値で判断していた ・2値しか持たないと透明度の値を推定する必要があり髪の毛などの... 2022.01.31 アプリケーション
学習手法 StylEx:犬と猫の違いは何かを視覚的に説明する新しい手法(1/2) 1.StylEx:犬と猫の違いは何かを視覚的に説明する新しい手法(1/2)まとめ ・ニューラルネットワークが何に着目して画像を分類しているか特定する事は困難 ・従来手法は注目している場所や全体的な特徴はわかるが特徴が分離できていない ・St... 2022.01.25 学習手法基礎理論
モデル Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(2/2) 1.Deep-MARC:初めてみる物体をマスクする能力を向上する秘訣(2/2)まとめ ・典型的なmask R-CNNの実装は完全教師有り設定ではパフォーマンスに影響を与えなかった ・部分的教師有り設定ではcropping-to-ground... 2021.09.22 モデル
モデル Omnimattes:動画内の影や砂煙も切出す事ができる最先端の人工知能(2/2) 1.Omnimattes:動画内の影や砂埃も切出す事ができる最先端の人工知能(2/2)まとめ ・画像を操作する手法は、偽情報を生成するために悪用される可能性があるので留意が必要 ・オムニマットは現状の制限としてカメラ位置が固定していないと画... 2021.09.06 モデル学習手法