こんにちは。

3月3日と4日に開催されたVL講習会にて実習を担当いたしました。3つの講義があるなか、わざわざ私が担当する講義を選んでくださったことを、大変嬉しく思います。少しでも皆さんの研究生活に刺激を与えることができたなら、ポスドク冥利に尽きます。
今回の実習は「宇宙から色んな雲を見つけよう 〜衛星画像×機械学習入門〜」とタイトルをつけまして、ひまわり8号・9号の巨大なデータから、K-meansを用いて雲型分類を行うというものでした。人生で初めて実習を計画し、教科書の作成から実習の流れまでを考えました。内容がどうかはアンケートを見て考え直すとして、かなり参加者も多く、嬉しかったです。改めまして、参加してくださった皆さま、TAの皆さん、スタッフの皆さんに感謝を申し上げます。以下で私からのオフィシャルの報告はさせていただいております。

上の記事でも紹介していますが、実習の内容を以下からDLいただけます。
https://drive.google.com/drive/folders/1V957bKnnGGNtQYFr4DpnmmBIl9JzH-4g
実習を経てバグの修正や誤植の修正などを行いました。バグの内容は致命的ではないのですが、最終的にできあがるクラスターマップのカラーバーに関する改善を行っています。本実習最後のカラーマップは、陸域などにクラスターされたものを取り除いた結果が表示されていますが、カラーバーにそれが反映されていませんでした。

また、実習中に需要のあった、Zarrファイル変換の方法なども追記しました。
オフィシャルな報告は上の記事に任せるとして、ここでは実習を作るにあたり困った点や工夫した点などを思い付く限り書いておきます。
続きを読む: VL講習会、実習へのご参加の御礼実習レベルについて
結構、最後まで悩みました。考えている内に、入門という言葉を忘れて凄くヘビーな内容にしました。PIや同僚に指摘されて気が付きましたが、多時刻のデータの使用や計算の最適化など、恐らく初学の人が求めていない内容に拘泥するようになっていたので、実習内容をいったん真っ新にして、シンプルな問題をシンプルに解くように工夫しました。また、1日目の実習を受けた方は感じたと思いますが、かなりスローペースで進みました。これは2日目からは改善したのですが、ある程度のペースをキープしながらTAをもっと頼るべきでした。置いて行かれる人が居ないように、最後まで悩んだのですが、先に進みたい人も居る中で、最後まで悩んでいました。
入門という事で、Xarrayを知ってもらうこと、機械学習の手法の初歩の初歩を知ってもらうことを意識しました。K-meansからスタートすれば、いずれ拡散モデルなどにもたどり着けるので、K-meansを採用しました。これなら実装も解説も簡単ですから、入門したての方にも楽しんでいただけるかなと思った次第です。また、可視化の派手さにもこだわっており、関数を予め作成しておくことで、同様のタスクなら誰でも映える図が作れるようになっています。利用だけできればいい人には十分で、興味のある人には関数の中身を読んでいただけるようにしたつもりです。可視化って、私は個人的に楽しいんですが、皆さんはいかがだったでしょうか。
テーマについて
実習のレベルとも関わるテーマの設定には、非常に苦労をしました。これに殆どの時間を費やしたと言っても過言ではありません。
- 機械学習が使えて
- 弊研究所CEReSのデータが活かせて
- 初心者の方が取り組めて
- 楽しさを知っていただける
を中心に考えました。小さいデータセットで取り組んでもらい、ラボに持ち帰ってもらい、大きな計算機で応用してもらえることも意識しました。Google Colab上で回りきるというのも重要な要素で、今回はギリギリ回しきることができるテーマにしたつもりです。
雲型のクラスタリングの他にも様々な案があったのですが、ビジュアルに訴えられ、機械学習入門としても最適なK-meansが使用できることから、このテーマに至りました。
内容の粒度について
何処までをテキストに書くべきか悩みました。例えば、Colabの使い方を何処までしっかり書くかや、直感でわかりそうな箇所を何処まで文書化するかは悩みました。結果として、丁寧よりには書いたのですが、そうするとページ数がドンドン増えてしまいますね。本の目的を考えながら作らないといけないと、当たり前ですが実感しました。
組版にTypstを、表紙の作成にはIllustratorを
今回は執筆から組版、印刷、搬入まで全部自分でやりました。(コミケを思い出しますねぇ。)組版にはtypstを使用しました。まだまだ新興の組版ですが、非常に軽量で使いやすかったです。書いているのがリアルタイムにプレビューできるのが本当に強い。ただし、引用文献の作成や、図表の取り扱いなど、まだまだかゆいところに手が届かないこともあり、苦労しました。お世話になった技術書典の書籍2つはこちらとこちらです。ありがとうございました。
また、表紙も自分でデザインしました。研究室のデザイナーの方や学生さんにアドバイスをもらいながら配置などを工夫しました。メインの画像にはクラスタリングの結果を立体的に載せ、それを囲うように、文字を枠を付けて配置しました。
反省点
- 実習の速度
- 内容の粒度感が統一されていない
- どうしてもバグや誤植が最後まで残った
- TAさんが手持ち無沙汰なときがあった
とりあえず、今気付くかぎりで書きました。
総じて、非常に良い経験ができました。自分自身も2016年学生の頃、千葉大にお邪魔してVL講習会を受けてきましたが、今その場で自分が講義できたことが非常に感慨深かったです。実習の進行速度など反省点もありますが、今自分が出来る限りの事はできたと思いますし、楽しかったと言ってくださった方がいらっしゃるのも非常に嬉しかったです。
研究者は研究がメインだと思うのですが、こうやって皆さんと何かしらの交流や知識の共有ができることも幸せなことだと思います。また皆さんとご縁がありましたら、嬉しいですね。
ありがとうございました。
PS: このブログのコメント欄などでも、ご感想などありましたらお書きください。