IT大生、洋楽和訳とプログラミング

これからのIT時代を生き抜くブログ。

CV学習日記①

教材

ex2_ConvAE.ipynb

目的:

  • オートエンコーダの実装を肌で体感すること。
  • ライブラリや関数について知ること。自分で関数を組み立てられるようになること。

今回のわからないこと

torchvision

  • 画像の前処理や学習済みモデルなどを提供するエコシステム

tqdm

  • 進捗状況や処理状況をプログレスバー(ステータスバー)として表示する機能
  • データを読みこむ時間やモデル構築にかかる時間などがステータスバーで表示できる

cuda

-「NVIDIA社製GPU」で並列計算をするための環境を提供するソフトウェア。


参考:e-words

テンソル

  • 0次元: スカラ
  • 1次元: ベクトル
  • 2次元: 行列
  • 3次元: 3次元テンソル

参考:ビジネスIT

ImageFolderとは?いつ使う?

  • 作成した画像ファイルをテンソルに取り込み、データローダを作成
    • つまり,画像ファイルをテンソルに変換してプログラムで処理できる形式にするということか?

参考:reafnex.net

 

ゼミの発表で大事なこととは

読んだ論文内容を発表する際に求められている3つのこと 012

 

DataLoaderとは

  • Dataset からサンプルを取得して、ミニバッチを作成するクラス
  • 基本的には、サンプルを取得する Dataset とバッチサイズを指定して作成
  • DataLoader は、iterate するとミニバッチを返すようになっています。

 

Dataset の作り方,目的

www.tryeting.jp