昨日、うちの研究会の合宿から帰ってきました。
合宿ではいろいろありましたが、つらつらと時系列にそって書いてみたいと思います。
8日昼
藤沢駅に集合です。団体割引使用のため、整列して駅に入場というイベントがありました。なんか遠足みたいです。で、1時間くらいたって湯河原駅に到着です。近くの商工会議所ですぐにプレゼンテーションが始まります。
まず、プレミアプレゼンという、合宿における貴重な時間を割いてでもプレゼンをする価値があると判断した人たちによるプレゼンテーションがありました。いくつかおもしろい研究がありましたが、プレミアプレゼンにするほどの価値のない研究もありました。この辺は自分の研究を客観的に見えてない人という感じがして、まぁ、微笑ましい感じでした。
で、次にM1プレゼンです。このM1プレゼンでこの前、知さんから教えていただいたベイズを用いた機能決定予測の話が出てきてびっくりです。この質疑応答で、
「でもその実験手法から測定される値って最大値が決まってないんだよね?だったらその結果の重要性が決まってない以上、複数の実験の結果から機能予測って難しくない?」
というような趣旨の質問がありました。
ここで、俺も論文を読んでいた手前、この質問に対する解答を自分の頭の中で構築してみました。
俺もベイズの論文を斜め読みしただけだったので、その程度の知識でいろいろ考えてみたのですが、とりあえず、複数のデータを取り扱って結果を出す場合、重要となってくるのは正規化と重み付けです。
正規化は、いろいろやり方はありますが、例えばマイクロアレイだったらログ正規化をかけた後に、Z-Score正規化をかけたりします。で、この正規化をきちんと考えておこなわないとマイクロアレイを用いた研究というのは紙屑と同じになってしまいます。(注意!)これは各実験、目的によって大幅に手法が異なってくるので、簡単にこれがいいとはいえませんが。
次に重み付けですが、これにもいろいろ方法はあります。一つはSVDや主成分分析をつかって、重み係数を出す手法です。しかし、まぁ、これはデータの束縛が結構きついので、ほとんどの研究者のかんに頼っているというのが現状っぽいです。
で、そのプレゼンでは上の二つのことが全く議論されてなかったので、まぁ、糾弾されてしかるべきだなーと感じました。これは情報学側の人間からみたら紙屑になりかねません。逆にそのあたりをきちんと戦略を立てて考えていたらとってもおもしろい研究になると思うので、がんばってほしいところです。さらにこの実験に関してはこうしたらいいんじゃないかーというのも考えましたが、ちょっとマニアックすぎるのでここで記述ストップです。
あと、人の研究成果を明らかに盗用した研究成果(俺のも含みます)があったりしてこれもびっくりです。学会発表だったら追放ものです。これは俺のアドバイザーがしっかり抗議してくれたので、一安心ですが、その研究成果はプログラムを書いただけで、まだE-CELL3のホームページにはアップロードしていなくて、その人には好意で貸したあげただけなので、びっくりしました。
他にもいろいろ感じるところがありましたが、俺と同じE-CELL3のシステム開発チームの先輩の発表にはすごい関心しました。おそらくうちの研究室で彼がやった仕事のすごさをわかった人は5人といないと思うのですが、院生からやってきて一年でこれだけの仕事をやってのけたその勤勉さには頭が下がります。このまえ、2時間くらいその先輩と今後の先輩の研究についてを議論(システム開発歴は俺の方がながいので)したことがあって、その時の議論のことがプレゼンにしっかりいかされていたので、すごい関心しました。見かけは人の良さそうな優しい感じの人ですが、仕事の速い極めて頭のいい人なんだなぁと感じました。
簡単にいうと、リックディアスの皮をかぶったザク3みたいな感じです。
他にもいろいろありましたが、とりあえずこんな感じで。
そのあと、ご飯を食べて、温泉入って、そのなかでいろいろあったりしましたが。とりあえず、ここで終わりです。
続く。
合宿ではいろいろありましたが、つらつらと時系列にそって書いてみたいと思います。
8日昼
藤沢駅に集合です。団体割引使用のため、整列して駅に入場というイベントがありました。なんか遠足みたいです。で、1時間くらいたって湯河原駅に到着です。近くの商工会議所ですぐにプレゼンテーションが始まります。
まず、プレミアプレゼンという、合宿における貴重な時間を割いてでもプレゼンをする価値があると判断した人たちによるプレゼンテーションがありました。いくつかおもしろい研究がありましたが、プレミアプレゼンにするほどの価値のない研究もありました。この辺は自分の研究を客観的に見えてない人という感じがして、まぁ、微笑ましい感じでした。
で、次にM1プレゼンです。このM1プレゼンでこの前、知さんから教えていただいたベイズを用いた機能決定予測の話が出てきてびっくりです。この質疑応答で、
「でもその実験手法から測定される値って最大値が決まってないんだよね?だったらその結果の重要性が決まってない以上、複数の実験の結果から機能予測って難しくない?」
というような趣旨の質問がありました。
ここで、俺も論文を読んでいた手前、この質問に対する解答を自分の頭の中で構築してみました。
俺もベイズの論文を斜め読みしただけだったので、その程度の知識でいろいろ考えてみたのですが、とりあえず、複数のデータを取り扱って結果を出す場合、重要となってくるのは正規化と重み付けです。
正規化は、いろいろやり方はありますが、例えばマイクロアレイだったらログ正規化をかけた後に、Z-Score正規化をかけたりします。で、この正規化をきちんと考えておこなわないとマイクロアレイを用いた研究というのは紙屑と同じになってしまいます。(注意!)これは各実験、目的によって大幅に手法が異なってくるので、簡単にこれがいいとはいえませんが。
次に重み付けですが、これにもいろいろ方法はあります。一つはSVDや主成分分析をつかって、重み係数を出す手法です。しかし、まぁ、これはデータの束縛が結構きついので、ほとんどの研究者のかんに頼っているというのが現状っぽいです。
で、そのプレゼンでは上の二つのことが全く議論されてなかったので、まぁ、糾弾されてしかるべきだなーと感じました。これは情報学側の人間からみたら紙屑になりかねません。逆にそのあたりをきちんと戦略を立てて考えていたらとってもおもしろい研究になると思うので、がんばってほしいところです。さらにこの実験に関してはこうしたらいいんじゃないかーというのも考えましたが、ちょっとマニアックすぎるのでここで記述ストップです。
あと、人の研究成果を明らかに盗用した研究成果(俺のも含みます)があったりしてこれもびっくりです。学会発表だったら追放ものです。これは俺のアドバイザーがしっかり抗議してくれたので、一安心ですが、その研究成果はプログラムを書いただけで、まだE-CELL3のホームページにはアップロードしていなくて、その人には好意で貸したあげただけなので、びっくりしました。
他にもいろいろ感じるところがありましたが、俺と同じE-CELL3のシステム開発チームの先輩の発表にはすごい関心しました。おそらくうちの研究室で彼がやった仕事のすごさをわかった人は5人といないと思うのですが、院生からやってきて一年でこれだけの仕事をやってのけたその勤勉さには頭が下がります。このまえ、2時間くらいその先輩と今後の先輩の研究についてを議論(システム開発歴は俺の方がながいので)したことがあって、その時の議論のことがプレゼンにしっかりいかされていたので、すごい関心しました。見かけは人の良さそうな優しい感じの人ですが、仕事の速い極めて頭のいい人なんだなぁと感じました。
簡単にいうと、リックディアスの皮をかぶったザク3みたいな感じです。
他にもいろいろありましたが、とりあえずこんな感じで。
そのあと、ご飯を食べて、温泉入って、そのなかでいろいろあったりしましたが。とりあえず、ここで終わりです。
続く。
コメント