こんにちわ、gamellaです。
今日は一日かけて研究振興基金の申請書を作成していました。なんか研究振興基金というとちょっと聞こえはいいですが、規模としては学内におけるものでかなり小さめです。
でもこれが結構いいトレーニングになりました。
俺の席の隣にいる講師のNさんは、「こういうのをきちんと書くということは、自分の研究を見直すうえでも、今後きちんとした研究を行う上でもすごい重要だよ」と言っていましたが、書いてみてかなり納得しました。
一応、お金を申請する以上、いくら少額でもやはり疑問点のないようにきちんとしたものを書かなければなりません。そういう意味でいいブラッシュアップになります。
と、いいつつまだ書いている訳ですが、なんとか少額でもいいので基金をゲットしたいものです。
今日は一日かけて研究振興基金の申請書を作成していました。なんか研究振興基金というとちょっと聞こえはいいですが、規模としては学内におけるものでかなり小さめです。
でもこれが結構いいトレーニングになりました。
俺の席の隣にいる講師のNさんは、「こういうのをきちんと書くということは、自分の研究を見直すうえでも、今後きちんとした研究を行う上でもすごい重要だよ」と言っていましたが、書いてみてかなり納得しました。
一応、お金を申請する以上、いくら少額でもやはり疑問点のないようにきちんとしたものを書かなければなりません。そういう意味でいいブラッシュアップになります。
と、いいつつまだ書いている訳ですが、なんとか少額でもいいので基金をゲットしたいものです。
旅行から帰ってきて、では、研究をしようかなと思い、コンピュータの前に座ってみたのですが、3時間ほどで頭が痛くなってきました。
1週間ほどコンピュータの前から離れて、改まって座ってみるとコンピュータの前に居るのって結構きついなぁと素朴に感じます。
まぁ、もう慣れましたが。
さてさて、まぁ、いろいろしなきゃいけないことがあるのですが、とりあえず、確率論的シミュレーションアルゴリズムの実装のために論文読んでます。
やっぱり、前提となる知識が少ないと、論文を読むという作業はとたんに難しくなります。Tau leapの論文を読むのにかれこれ5時間ほどかかっていますが、まだ頭のなかでアルゴリズムがまとまりません。簡単な論理の飛躍が迫えなかったり、前提となる公式がわからなかったりします。
困った、困った。
まぁ、この辺の穴を埋めるところからスタートしなきゃいけないわけですね。
ーーー
このTau leapの基となるGillespie法は僕がこの1年ほど前から研究に使用しているアルゴリズムです。まぁ、詳細は省くとして、このアルゴリズムはじつは生体内シミュレーションの研究に用いるのには問題のあるアルゴリズムです。
その第一の理由は、やはり状態の均一仮定にからむことでしょう。
Gillespie法は化学系から発展してきたアルゴリズムであり、これを生体内反応、特に遺伝子発現のシミュレーションに使うようになってきたのは結構最近です。
で、現在このGillespie法でシミュレーションを行っている遺伝子発現というものはむちゃくちゃ場所の制限を受けます。数少ないDNAがそこに存在しなければ絶対に反応は起きないし、くっついたり、離れたりする反応も絶対数が少ないかつ、場所が固定されているため、場所的要因を考えないと正確にはシミュレーションできません。
一応、シミュレーションではそれらの場所的要因も含めた見かけ上の(遺伝子発現のシミュレーションの最高頻出単語のようです。)パラメータを使用しているという理論が一般的な回避方法ですが、まぁ、これも怪しいもので、なにより見かけ上にしちゃったらGillespieで確かめたい確率的な影響がきちんと再現されないじゃんという批判が当然発生します。
まぁ、しかし、現実的にこれより効率がよく、使いやすいシミュレーションアルゴリズムはとりあえず存在しないので、みんなGillespieを使用しているのですが、このGIllespie法を前提とし、ノイズの理論を整理した新しい遺伝子発現ノイズをシミュレーションするための式が登場しました。
それが、ついこのまえNatureにでた、
Paulsson J.
Summing up the noise in gene networks.
Nature. 2004 Jan 29;427(6973):415-8.
PMID: 14749823
です。
これはいままでGillespieで便宜的に再現していた遺伝子発現のノイズをきちんと発生源を理論的に考えて再現しようという式です。まぁ、理論自体はマルコフ過程に基づくものなので、対してかわりませんが、実験との連携がかなり強固に行えます。
で、この論文自体、とってもおもしろいのですが、なにより、驚くべきことは、その論文発表形式です。
articleでもreviewでもありません。analysisです。
最初見たときポカーンですよ。
なんだろう、この形式。
最初に式が書いてあって、あとはこの式の説明を書き、最後にこの式が今までの実験を以下に効率よく説明できるかが書いてあります。
うわー、すげーなー。俺が今まで考えていたノイズの捉え方よりもかなり洗練されています。こういう論文の出し方もあるんだー、と勉強になりました。
まぁ、それだけです。
ーーー
最近、この遺伝子発現のノイズという分野はかなり故意的に盛り上げられた分野だなということを感じます。それについては、また今度。(忘れるかも)
1週間ほどコンピュータの前から離れて、改まって座ってみるとコンピュータの前に居るのって結構きついなぁと素朴に感じます。
まぁ、もう慣れましたが。
さてさて、まぁ、いろいろしなきゃいけないことがあるのですが、とりあえず、確率論的シミュレーションアルゴリズムの実装のために論文読んでます。
やっぱり、前提となる知識が少ないと、論文を読むという作業はとたんに難しくなります。Tau leapの論文を読むのにかれこれ5時間ほどかかっていますが、まだ頭のなかでアルゴリズムがまとまりません。簡単な論理の飛躍が迫えなかったり、前提となる公式がわからなかったりします。
困った、困った。
まぁ、この辺の穴を埋めるところからスタートしなきゃいけないわけですね。
ーーー
このTau leapの基となるGillespie法は僕がこの1年ほど前から研究に使用しているアルゴリズムです。まぁ、詳細は省くとして、このアルゴリズムはじつは生体内シミュレーションの研究に用いるのには問題のあるアルゴリズムです。
その第一の理由は、やはり状態の均一仮定にからむことでしょう。
Gillespie法は化学系から発展してきたアルゴリズムであり、これを生体内反応、特に遺伝子発現のシミュレーションに使うようになってきたのは結構最近です。
で、現在このGillespie法でシミュレーションを行っている遺伝子発現というものはむちゃくちゃ場所の制限を受けます。数少ないDNAがそこに存在しなければ絶対に反応は起きないし、くっついたり、離れたりする反応も絶対数が少ないかつ、場所が固定されているため、場所的要因を考えないと正確にはシミュレーションできません。
一応、シミュレーションではそれらの場所的要因も含めた見かけ上の(遺伝子発現のシミュレーションの最高頻出単語のようです。)パラメータを使用しているという理論が一般的な回避方法ですが、まぁ、これも怪しいもので、なにより見かけ上にしちゃったらGillespieで確かめたい確率的な影響がきちんと再現されないじゃんという批判が当然発生します。
まぁ、しかし、現実的にこれより効率がよく、使いやすいシミュレーションアルゴリズムはとりあえず存在しないので、みんなGillespieを使用しているのですが、このGIllespie法を前提とし、ノイズの理論を整理した新しい遺伝子発現ノイズをシミュレーションするための式が登場しました。
それが、ついこのまえNatureにでた、
Paulsson J.
Summing up the noise in gene networks.
Nature. 2004 Jan 29;427(6973):415-8.
PMID: 14749823
です。
これはいままでGillespieで便宜的に再現していた遺伝子発現のノイズをきちんと発生源を理論的に考えて再現しようという式です。まぁ、理論自体はマルコフ過程に基づくものなので、対してかわりませんが、実験との連携がかなり強固に行えます。
で、この論文自体、とってもおもしろいのですが、なにより、驚くべきことは、その論文発表形式です。
articleでもreviewでもありません。analysisです。
最初見たときポカーンですよ。
なんだろう、この形式。
最初に式が書いてあって、あとはこの式の説明を書き、最後にこの式が今までの実験を以下に効率よく説明できるかが書いてあります。
うわー、すげーなー。俺が今まで考えていたノイズの捉え方よりもかなり洗練されています。こういう論文の出し方もあるんだー、と勉強になりました。
まぁ、それだけです。
ーーー
最近、この遺伝子発現のノイズという分野はかなり故意的に盛り上げられた分野だなということを感じます。それについては、また今度。(忘れるかも)
この1ヶ月ほどサーベイを繰り返した結果、自分の今の研究は手法の目新しさはともあれ、論文を書くまでの内容に達していないという結論に達した。
先輩にこれを話した結果、「じゃぁ6月までに内容をまとめて何とか出そうよ」というお言葉をいただく。
というわけで、早速モデル拡張のための論文を発注。現在のモデルは、LacZの確率論的モデルだが、この手法をTetとlambdaのモデルに応用する。lambdaのモデルのパラメータはおもしろいように見つかるのだが、Tetは皆無。まぁ、このくらいならGAで推測可能なので、そんなに致命的ではない。
そして仕事を一時すべて切り替えて、確率論的シミュレーションアルゴリズムの開発を行うことにした。
現在うちのプロジェクトでは、確率論的シミュレーションアルゴリズムにGillespieをGibsonが改良したNext Reaction Methodという極めてエレガントでパワフルなシミュレーション技法が採用されているのだが、同時にGillespie本人がその後開発したTau Leap Methodも実装するとのこと。Tau Leap Methodには前々から興味が合ったので、開発担当にしてもらった。
それ関係のサーベイをしているうちに前々から注目していたKerzekが確率論的シミュレーションでMax Time Step Methodというアルゴリズムを10日ほどまえに発表していた。
この分野は最近異常に注目されているので、進化がはやい。この4年でシミュレーションスピードは単純に100倍以上高速化されている。この論文は読むのが非常に楽しみ。まぁ、そんな感じ。
先輩にこれを話した結果、「じゃぁ6月までに内容をまとめて何とか出そうよ」というお言葉をいただく。
というわけで、早速モデル拡張のための論文を発注。現在のモデルは、LacZの確率論的モデルだが、この手法をTetとlambdaのモデルに応用する。lambdaのモデルのパラメータはおもしろいように見つかるのだが、Tetは皆無。まぁ、このくらいならGAで推測可能なので、そんなに致命的ではない。
そして仕事を一時すべて切り替えて、確率論的シミュレーションアルゴリズムの開発を行うことにした。
現在うちのプロジェクトでは、確率論的シミュレーションアルゴリズムにGillespieをGibsonが改良したNext Reaction Methodという極めてエレガントでパワフルなシミュレーション技法が採用されているのだが、同時にGillespie本人がその後開発したTau Leap Methodも実装するとのこと。Tau Leap Methodには前々から興味が合ったので、開発担当にしてもらった。
それ関係のサーベイをしているうちに前々から注目していたKerzekが確率論的シミュレーションでMax Time Step Methodというアルゴリズムを10日ほどまえに発表していた。
この分野は最近異常に注目されているので、進化がはやい。この4年でシミュレーションスピードは単純に100倍以上高速化されている。この論文は読むのが非常に楽しみ。まぁ、そんな感じ。
研究にたいする独り言
2004年2月21日 研究前回、科学者についてのかなり青臭いことを書きましたが、実際、どんな研究をすべきなんだという話になったとき、俺たちの研究会がしている今の研究は生物というモノに対して今までみることのできなかった視点から多くの知見を提供するだろうということを言うことは出来ます。
その根拠は簡単にいうと戦略の違いです。
自分でいうのもなんですが、俺は論文をかなり読みます。自分の興味をもった分野なら、今の研究に関係あるか、ないかに関わらず、かなり読んでいると思います。
それで思うことは、ほとんどの生物学者は漠然と頭の中できちんと組み立てられたモデル(理解という言葉を使ってもいいです)で生物というものの仕組み、本質が理解できるという幻想を持っているということです。
Natureの情報生物学の総説でゴールドベターは言いました。
「現時点でモデル構築作業は職人芸に近い。」
これはまさしく本質をついています。
ある機能を解明する研究と、その機能を組み合わせてシステムを構築し、システムを解明する研究があるとします。
これらの労力が、一つにつき、等価であると仮定した場合、機能を組み合わせシステムを構築する労力は機能の数が増えるに従って、組み合わせが増大することから指数的に上昇します。生物は機能の固まりですので、機能を組み合わせシステムを構築する労力はかなり高いと推測されます。
このシステムは人間だけで、理解するのは不可能なので、現在ほとんどの生物学者は何らかの形でコンピュータを利用していると思います。森博嗣の言葉を借りれば、逆説的な表現ですが「現在、コンピュータを利用せず研究を行うことはもはや一つのスタイルとして認めるべき」水準にまで達していると思います。
しかし、基本的にコンピュータが提供するのは、機能をきちんとした情報として保持してくれることだけです。そこからシステムを構築するのは、現時点ではゴールドベターの言うとおり職人芸です。
これをクリアするためにはよくできたシステム(ソフトウエア)がその作業をサポートする必要があります。とりあえず、今の研究手法を根本的に変えない限りは、それ以外に方法はないと思います。
そんなわけで、俺らの研究会は、生物学的な研究と平行して、ソフトウエアとアルゴリズムの研究もしているわけです。そして、そのなかでもソフトウエアに力を注いでいるわけです。
まぁ、完全なシミュレーションが成功しても結局そこから新しい知見を引き出すのは人間の役目なので、コンピュータが出来るのはそこまでなのですが、とりあえず、そこから先のことは今の目標が達成してから考えればいいというのが、今のところの俺のスタンスです。
これが、では全体の科学というもののなかでどんな位置づけになるのかという事はまた今度機会があったら書こうと思います。どうせこの話題は青臭いものになっちゃうので。
その根拠は簡単にいうと戦略の違いです。
自分でいうのもなんですが、俺は論文をかなり読みます。自分の興味をもった分野なら、今の研究に関係あるか、ないかに関わらず、かなり読んでいると思います。
それで思うことは、ほとんどの生物学者は漠然と頭の中できちんと組み立てられたモデル(理解という言葉を使ってもいいです)で生物というものの仕組み、本質が理解できるという幻想を持っているということです。
Natureの情報生物学の総説でゴールドベターは言いました。
「現時点でモデル構築作業は職人芸に近い。」
これはまさしく本質をついています。
ある機能を解明する研究と、その機能を組み合わせてシステムを構築し、システムを解明する研究があるとします。
これらの労力が、一つにつき、等価であると仮定した場合、機能を組み合わせシステムを構築する労力は機能の数が増えるに従って、組み合わせが増大することから指数的に上昇します。生物は機能の固まりですので、機能を組み合わせシステムを構築する労力はかなり高いと推測されます。
このシステムは人間だけで、理解するのは不可能なので、現在ほとんどの生物学者は何らかの形でコンピュータを利用していると思います。森博嗣の言葉を借りれば、逆説的な表現ですが「現在、コンピュータを利用せず研究を行うことはもはや一つのスタイルとして認めるべき」水準にまで達していると思います。
しかし、基本的にコンピュータが提供するのは、機能をきちんとした情報として保持してくれることだけです。そこからシステムを構築するのは、現時点ではゴールドベターの言うとおり職人芸です。
これをクリアするためにはよくできたシステム(ソフトウエア)がその作業をサポートする必要があります。とりあえず、今の研究手法を根本的に変えない限りは、それ以外に方法はないと思います。
そんなわけで、俺らの研究会は、生物学的な研究と平行して、ソフトウエアとアルゴリズムの研究もしているわけです。そして、そのなかでもソフトウエアに力を注いでいるわけです。
まぁ、完全なシミュレーションが成功しても結局そこから新しい知見を引き出すのは人間の役目なので、コンピュータが出来るのはそこまでなのですが、とりあえず、そこから先のことは今の目標が達成してから考えればいいというのが、今のところの俺のスタンスです。
これが、では全体の科学というもののなかでどんな位置づけになるのかという事はまた今度機会があったら書こうと思います。どうせこの話題は青臭いものになっちゃうので。
科学者についてを考える事ってなんですか?
2004年2月16日 研究最近、漠然と将来について考えたりする。
まだよくわからないが、将来的に俺が生物学者になるというヴィジョンはあまりよくわかない。たぶん、それなりにやっていけるだろうとは思うが、そこに俺の全力を傾けられるかどうかとなるとすごい難しい気がする。
その理由の一つに、おそらく俺の生きている間に生物学は完成しないだろうという実感があるからだ。
たとえば、人間はどこからきたのか?なぜ生きるのか?そして、どこへ向かうのか?というような2000年前から議論している問題に対して、答えることが科学者の役目だとしたら、少なくとも、生物学者はその根元的な問からかなり逃避しているとおもう。それ以上に哲学者とかも逃避してそうだけど。
なぜなら、今のアプローチではその問に答えることなどできないことを知っていて、みんな研究しているからだ。
この前話した、「いけてる研究、いけてない研究」もそうだ。実に矮小なくだらない考え方である。ジョジョ世界だったら、「豚にでも食わしておけ!!」くらいのくだらない考えだ。もしこれを確信犯としてやってなかったと考えたら寒気がする。
まぁ、とりあえず、今日もこんなことを考えながら研究をしているわけだが、少なくとも、自分に矮小感を抱かない仕事を見つけたいと考えている。親からもらったあと2年間の時間をフルに使ってそのことを追求したい。
、、、
それにしても、今日は青いこと書いたなー、って思った。
まだよくわからないが、将来的に俺が生物学者になるというヴィジョンはあまりよくわかない。たぶん、それなりにやっていけるだろうとは思うが、そこに俺の全力を傾けられるかどうかとなるとすごい難しい気がする。
その理由の一つに、おそらく俺の生きている間に生物学は完成しないだろうという実感があるからだ。
たとえば、人間はどこからきたのか?なぜ生きるのか?そして、どこへ向かうのか?というような2000年前から議論している問題に対して、答えることが科学者の役目だとしたら、少なくとも、生物学者はその根元的な問からかなり逃避しているとおもう。それ以上に哲学者とかも逃避してそうだけど。
なぜなら、今のアプローチではその問に答えることなどできないことを知っていて、みんな研究しているからだ。
この前話した、「いけてる研究、いけてない研究」もそうだ。実に矮小なくだらない考え方である。ジョジョ世界だったら、「豚にでも食わしておけ!!」くらいのくだらない考えだ。もしこれを確信犯としてやってなかったと考えたら寒気がする。
まぁ、とりあえず、今日もこんなことを考えながら研究をしているわけだが、少なくとも、自分に矮小感を抱かない仕事を見つけたいと考えている。親からもらったあと2年間の時間をフルに使ってそのことを追求したい。
、、、
それにしても、今日は青いこと書いたなー、って思った。
で、解析終わったかどうか、また見に来たらまたもやvvectorエラー起きてます。kusoga!!
...
3回目のチャレンジでうまくいっているようです。ii!!
...
3回目のチャレンジでうまくいっているようです。ii!!
こんにちわ。解析の結果を見に、学校にきてみたらvvectorエラーで止まっていましたgamellaです。konokusoga!
で、また解析をかけ直し、今は暇なので日記を書いてます。
じゃあ、まぁ、続きです。
8日夜
ご飯を食べました。小鉢に刺身、メインはエビフライという湯河原で食べるメニューかしらこれ?と思うようなご飯ですが、基本的に何でもおいしく食べられます。その後、早速お風呂に、、、
で、お風呂で誰も聴いていないと思いはなしていたSさんとK君との会話がとなりの女風呂にまる聞こえだったことが判明。まぁ、僕は必死でみんなの毒舌を押さえる役に回っていたので、ことなきをえましたが、なかなかひどい事件でした。しかも、ここの露天風呂は女風呂はガードが堅いが男風呂はベランダから丸見えです。
で、その後、3人で会話を広めないようにネゴシエーション。よかったー、俺はひどいこと言わないで。
その後、いろいろありましたが、さらに今の内容に輪をかけて研究会内輪ネタになるため、とりあえず省略。あとはいろいろして寝ましたとさ。
9日
9日のメニューはゲストプレゼン、M2プレゼン、博士号プレゼンというメニューです。
ゲストプレゼンがおもしろい試しはないのですが、今回はおもしろいのが一個ありました。内容的には情報生物学学会へ毒をはいたり、他人の研究の評価をしたり、自分の研究の自慢をしたりというかなりエキセントリックな内容だったのですが、彼の人格がそのプレゼンからにじみ出ているようで非常に興味深いものでした。このようなとんがったプレゼンを人前に晒す決意をした過程こそプレゼンしてほしいと思いました。
その中でも、特に彼曰く「いけてる研究」と「いけてない研究」についての話があり、彼が言うには世の中には「いけてる研究」と「いけてない研究」があり、それを敏感に察知する能力が研究者に必要だということでした。
この話題はこの後の博士号取得プレゼンのところでふれるので、とりあえず、ストップ。
で、次のM2プレゼンですが、また自分の研究そっちのけで情報生物学ってNANDA?を語る人が登場。これって修士号発表プレゼンじゃないのかな?
まぁ、教員も笑って見てるので、問題はないようですが、こういう一部の人に対しては公平でないことが平然と通っているあたりが、いかにもこの研究会らしいです。研究とは全く関係のない内容が、研究の内容を圧迫して、研究のプレゼン自体は省略しすぎで、ほとんどの学部生にはなにがなんだかわからない状況でしたが、特に問題はないもようです。問題意識ゼロ。なんだかなー。
彼のプレゼンを見ながら、合同勝利のフレーバーテキストが頭をよぎりました。
「不完全な部品を組み合わせて、完全な機械を作ることは可能だよ。」ーウルザ
で、ここまでのプレゼンはどうでもよくて、最も大事な俺の研究会当初からのアドバイザーS氏の博士号取得プレゼンがありました。
内容はもう10分でどうやって説明するんだこれという盛りだくさんの内容でしたが、メインはE-CELL3の開発に踏み込んだ、極めて興味深い内容でした。前の日に先輩の博士論文を読んで涙ぐんでいたため、感慨がこみ上げてきました。
その後の問答の答えで、
「僕は今でも全細胞シミュレーションを目的にソフトウエア開発をしています。」
というめちゃかっこいい解答をしたり、ほかにもいろいろ心に残ることがありましたが、先輩の思考はこの研究会のみならず、情報生物学における至宝です。もうすぐ、研究会からいなくなるので、できるだけ多くのことを学びたいと思いました。
で、さっきのいけてる研究、いけてない研究の話なのですが、先輩の仕事を見てると本当にどうでもいい考えだという事が実感できるので、詳しくふれるのはやっぱり面倒だしやめます。
他にもいろいろいろんなことがありましたが、終わりよければすべてよしのいい合宿でした。
で、また解析をかけ直し、今は暇なので日記を書いてます。
じゃあ、まぁ、続きです。
8日夜
ご飯を食べました。小鉢に刺身、メインはエビフライという湯河原で食べるメニューかしらこれ?と思うようなご飯ですが、基本的に何でもおいしく食べられます。その後、早速お風呂に、、、
で、お風呂で誰も聴いていないと思いはなしていたSさんとK君との会話がとなりの女風呂にまる聞こえだったことが判明。まぁ、僕は必死でみんなの毒舌を押さえる役に回っていたので、ことなきをえましたが、なかなかひどい事件でした。しかも、ここの露天風呂は女風呂はガードが堅いが男風呂はベランダから丸見えです。
で、その後、3人で会話を広めないようにネゴシエーション。よかったー、俺はひどいこと言わないで。
その後、いろいろありましたが、さらに今の内容に輪をかけて研究会内輪ネタになるため、とりあえず省略。あとはいろいろして寝ましたとさ。
9日
9日のメニューはゲストプレゼン、M2プレゼン、博士号プレゼンというメニューです。
ゲストプレゼンがおもしろい試しはないのですが、今回はおもしろいのが一個ありました。内容的には情報生物学学会へ毒をはいたり、他人の研究の評価をしたり、自分の研究の自慢をしたりというかなりエキセントリックな内容だったのですが、彼の人格がそのプレゼンからにじみ出ているようで非常に興味深いものでした。このようなとんがったプレゼンを人前に晒す決意をした過程こそプレゼンしてほしいと思いました。
その中でも、特に彼曰く「いけてる研究」と「いけてない研究」についての話があり、彼が言うには世の中には「いけてる研究」と「いけてない研究」があり、それを敏感に察知する能力が研究者に必要だということでした。
この話題はこの後の博士号取得プレゼンのところでふれるので、とりあえず、ストップ。
で、次のM2プレゼンですが、また自分の研究そっちのけで情報生物学ってNANDA?を語る人が登場。これって修士号発表プレゼンじゃないのかな?
まぁ、教員も笑って見てるので、問題はないようですが、こういう一部の人に対しては公平でないことが平然と通っているあたりが、いかにもこの研究会らしいです。研究とは全く関係のない内容が、研究の内容を圧迫して、研究のプレゼン自体は省略しすぎで、ほとんどの学部生にはなにがなんだかわからない状況でしたが、特に問題はないもようです。問題意識ゼロ。なんだかなー。
彼のプレゼンを見ながら、合同勝利のフレーバーテキストが頭をよぎりました。
「不完全な部品を組み合わせて、完全な機械を作ることは可能だよ。」ーウルザ
で、ここまでのプレゼンはどうでもよくて、最も大事な俺の研究会当初からのアドバイザーS氏の博士号取得プレゼンがありました。
内容はもう10分でどうやって説明するんだこれという盛りだくさんの内容でしたが、メインはE-CELL3の開発に踏み込んだ、極めて興味深い内容でした。前の日に先輩の博士論文を読んで涙ぐんでいたため、感慨がこみ上げてきました。
その後の問答の答えで、
「僕は今でも全細胞シミュレーションを目的にソフトウエア開発をしています。」
というめちゃかっこいい解答をしたり、ほかにもいろいろ心に残ることがありましたが、先輩の思考はこの研究会のみならず、情報生物学における至宝です。もうすぐ、研究会からいなくなるので、できるだけ多くのことを学びたいと思いました。
で、さっきのいけてる研究、いけてない研究の話なのですが、先輩の仕事を見てると本当にどうでもいい考えだという事が実感できるので、詳しくふれるのはやっぱり面倒だしやめます。
他にもいろいろいろんなことがありましたが、終わりよければすべてよしのいい合宿でした。
昨日、うちの研究会の合宿から帰ってきました。
合宿ではいろいろありましたが、つらつらと時系列にそって書いてみたいと思います。
8日昼
藤沢駅に集合です。団体割引使用のため、整列して駅に入場というイベントがありました。なんか遠足みたいです。で、1時間くらいたって湯河原駅に到着です。近くの商工会議所ですぐにプレゼンテーションが始まります。
まず、プレミアプレゼンという、合宿における貴重な時間を割いてでもプレゼンをする価値があると判断した人たちによるプレゼンテーションがありました。いくつかおもしろい研究がありましたが、プレミアプレゼンにするほどの価値のない研究もありました。この辺は自分の研究を客観的に見えてない人という感じがして、まぁ、微笑ましい感じでした。
で、次にM1プレゼンです。このM1プレゼンでこの前、知さんから教えていただいたベイズを用いた機能決定予測の話が出てきてびっくりです。この質疑応答で、
「でもその実験手法から測定される値って最大値が決まってないんだよね?だったらその結果の重要性が決まってない以上、複数の実験の結果から機能予測って難しくない?」
というような趣旨の質問がありました。
ここで、俺も論文を読んでいた手前、この質問に対する解答を自分の頭の中で構築してみました。
俺もベイズの論文を斜め読みしただけだったので、その程度の知識でいろいろ考えてみたのですが、とりあえず、複数のデータを取り扱って結果を出す場合、重要となってくるのは正規化と重み付けです。
正規化は、いろいろやり方はありますが、例えばマイクロアレイだったらログ正規化をかけた後に、Z-Score正規化をかけたりします。で、この正規化をきちんと考えておこなわないとマイクロアレイを用いた研究というのは紙屑と同じになってしまいます。(注意!)これは各実験、目的によって大幅に手法が異なってくるので、簡単にこれがいいとはいえませんが。
次に重み付けですが、これにもいろいろ方法はあります。一つはSVDや主成分分析をつかって、重み係数を出す手法です。しかし、まぁ、これはデータの束縛が結構きついので、ほとんどの研究者のかんに頼っているというのが現状っぽいです。
で、そのプレゼンでは上の二つのことが全く議論されてなかったので、まぁ、糾弾されてしかるべきだなーと感じました。これは情報学側の人間からみたら紙屑になりかねません。逆にそのあたりをきちんと戦略を立てて考えていたらとってもおもしろい研究になると思うので、がんばってほしいところです。さらにこの実験に関してはこうしたらいいんじゃないかーというのも考えましたが、ちょっとマニアックすぎるのでここで記述ストップです。
あと、人の研究成果を明らかに盗用した研究成果(俺のも含みます)があったりしてこれもびっくりです。学会発表だったら追放ものです。これは俺のアドバイザーがしっかり抗議してくれたので、一安心ですが、その研究成果はプログラムを書いただけで、まだE-CELL3のホームページにはアップロードしていなくて、その人には好意で貸したあげただけなので、びっくりしました。
他にもいろいろ感じるところがありましたが、俺と同じE-CELL3のシステム開発チームの先輩の発表にはすごい関心しました。おそらくうちの研究室で彼がやった仕事のすごさをわかった人は5人といないと思うのですが、院生からやってきて一年でこれだけの仕事をやってのけたその勤勉さには頭が下がります。このまえ、2時間くらいその先輩と今後の先輩の研究についてを議論(システム開発歴は俺の方がながいので)したことがあって、その時の議論のことがプレゼンにしっかりいかされていたので、すごい関心しました。見かけは人の良さそうな優しい感じの人ですが、仕事の速い極めて頭のいい人なんだなぁと感じました。
簡単にいうと、リックディアスの皮をかぶったザク3みたいな感じです。
他にもいろいろありましたが、とりあえずこんな感じで。
そのあと、ご飯を食べて、温泉入って、そのなかでいろいろあったりしましたが。とりあえず、ここで終わりです。
続く。
合宿ではいろいろありましたが、つらつらと時系列にそって書いてみたいと思います。
8日昼
藤沢駅に集合です。団体割引使用のため、整列して駅に入場というイベントがありました。なんか遠足みたいです。で、1時間くらいたって湯河原駅に到着です。近くの商工会議所ですぐにプレゼンテーションが始まります。
まず、プレミアプレゼンという、合宿における貴重な時間を割いてでもプレゼンをする価値があると判断した人たちによるプレゼンテーションがありました。いくつかおもしろい研究がありましたが、プレミアプレゼンにするほどの価値のない研究もありました。この辺は自分の研究を客観的に見えてない人という感じがして、まぁ、微笑ましい感じでした。
で、次にM1プレゼンです。このM1プレゼンでこの前、知さんから教えていただいたベイズを用いた機能決定予測の話が出てきてびっくりです。この質疑応答で、
「でもその実験手法から測定される値って最大値が決まってないんだよね?だったらその結果の重要性が決まってない以上、複数の実験の結果から機能予測って難しくない?」
というような趣旨の質問がありました。
ここで、俺も論文を読んでいた手前、この質問に対する解答を自分の頭の中で構築してみました。
俺もベイズの論文を斜め読みしただけだったので、その程度の知識でいろいろ考えてみたのですが、とりあえず、複数のデータを取り扱って結果を出す場合、重要となってくるのは正規化と重み付けです。
正規化は、いろいろやり方はありますが、例えばマイクロアレイだったらログ正規化をかけた後に、Z-Score正規化をかけたりします。で、この正規化をきちんと考えておこなわないとマイクロアレイを用いた研究というのは紙屑と同じになってしまいます。(注意!)これは各実験、目的によって大幅に手法が異なってくるので、簡単にこれがいいとはいえませんが。
次に重み付けですが、これにもいろいろ方法はあります。一つはSVDや主成分分析をつかって、重み係数を出す手法です。しかし、まぁ、これはデータの束縛が結構きついので、ほとんどの研究者のかんに頼っているというのが現状っぽいです。
で、そのプレゼンでは上の二つのことが全く議論されてなかったので、まぁ、糾弾されてしかるべきだなーと感じました。これは情報学側の人間からみたら紙屑になりかねません。逆にそのあたりをきちんと戦略を立てて考えていたらとってもおもしろい研究になると思うので、がんばってほしいところです。さらにこの実験に関してはこうしたらいいんじゃないかーというのも考えましたが、ちょっとマニアックすぎるのでここで記述ストップです。
あと、人の研究成果を明らかに盗用した研究成果(俺のも含みます)があったりしてこれもびっくりです。学会発表だったら追放ものです。これは俺のアドバイザーがしっかり抗議してくれたので、一安心ですが、その研究成果はプログラムを書いただけで、まだE-CELL3のホームページにはアップロードしていなくて、その人には好意で貸したあげただけなので、びっくりしました。
他にもいろいろ感じるところがありましたが、俺と同じE-CELL3のシステム開発チームの先輩の発表にはすごい関心しました。おそらくうちの研究室で彼がやった仕事のすごさをわかった人は5人といないと思うのですが、院生からやってきて一年でこれだけの仕事をやってのけたその勤勉さには頭が下がります。このまえ、2時間くらいその先輩と今後の先輩の研究についてを議論(システム開発歴は俺の方がながいので)したことがあって、その時の議論のことがプレゼンにしっかりいかされていたので、すごい関心しました。見かけは人の良さそうな優しい感じの人ですが、仕事の速い極めて頭のいい人なんだなぁと感じました。
簡単にいうと、リックディアスの皮をかぶったザク3みたいな感じです。
他にもいろいろありましたが、とりあえずこんな感じで。
そのあと、ご飯を食べて、温泉入って、そのなかでいろいろあったりしましたが。とりあえず、ここで終わりです。
続く。
卒業制作で行った研究が、とりあえず、一区切りついたので、論文を書いてみようかと考えています。
まぁ、たぶん、最初はかなり難しいんじゃないかと思いますが、、、
2月いっぱいかけて完成を目指せばいいかなと。
内容的には「遺伝子発現のノイズ」で、遺伝子ネットワークシミュレーションという極めて狭い分野で、最もホットな話題なのですが、今考えているのはどういう論文誌に投稿するかです。
最近この手のネタが多いのが、Nature、Scienceなのですが、まぁ、この辺はよほどインパクトがないとシミュレーションは通らないのであまり考えないとして、この手の話が最近出てるのは、PNAS、Genome Research、JTBあたりでしょうか。研究会の先輩はJMBメインで投稿してますが。さすがにそれはきついです。
とりあえず、流れとしては、PNAS記念受験、Genome ResearchかJTBに採用。みたいなことが起きたらいいな、と捕らぬ狸の皮算用してます。まぁ、はじめからでかい目標持っていた方がいいと思うし、なにより、シミュレーションという分野は結構アイデア勝負なところが多いので。
とりあえず、「英語の論文の書き方」からスタートです。
ーーー
なんか今回の日記システムの変更に関して他の人の日記を読むと、不満も結構多いようなのですが、僕はかなり好きです。そんな長い日記書くわけでもないし、デザインもすっきりしていいと思います。あと、トラックバック機能がつくのはかなりうれしいです。
できたらコメント機能も欲しいのですが、管理が大変になりそうだし、負荷もあがりそうですから、そこまでは望みません。システム開発を良心で行っている方々には最大限の感謝で応えたいものです。代替案のない批判ほどつまらないことはありません。
まぁ、使いにくいって言っている人たちは、たぶん他のblogとかwikiをあまりさわってことのない人たちなんだろうなぁ、と漠然と感じたり。
まぁ、たぶん、最初はかなり難しいんじゃないかと思いますが、、、
2月いっぱいかけて完成を目指せばいいかなと。
内容的には「遺伝子発現のノイズ」で、遺伝子ネットワークシミュレーションという極めて狭い分野で、最もホットな話題なのですが、今考えているのはどういう論文誌に投稿するかです。
最近この手のネタが多いのが、Nature、Scienceなのですが、まぁ、この辺はよほどインパクトがないとシミュレーションは通らないのであまり考えないとして、この手の話が最近出てるのは、PNAS、Genome Research、JTBあたりでしょうか。研究会の先輩はJMBメインで投稿してますが。さすがにそれはきついです。
とりあえず、流れとしては、PNAS記念受験、Genome ResearchかJTBに採用。みたいなことが起きたらいいな、と捕らぬ狸の皮算用してます。まぁ、はじめからでかい目標持っていた方がいいと思うし、なにより、シミュレーションという分野は結構アイデア勝負なところが多いので。
とりあえず、「英語の論文の書き方」からスタートです。
ーーー
なんか今回の日記システムの変更に関して他の人の日記を読むと、不満も結構多いようなのですが、僕はかなり好きです。そんな長い日記書くわけでもないし、デザインもすっきりしていいと思います。あと、トラックバック機能がつくのはかなりうれしいです。
できたらコメント機能も欲しいのですが、管理が大変になりそうだし、負荷もあがりそうですから、そこまでは望みません。システム開発を良心で行っている方々には最大限の感謝で応えたいものです。代替案のない批判ほどつまらないことはありません。
まぁ、使いにくいって言っている人たちは、たぶん他のblogとかwikiをあまりさわってことのない人たちなんだろうなぁ、と漠然と感じたり。
俺「最近、日記かいてませんねー。」
俺「確かに、確かにねー。」
俺「卒論も終わったし書きましょうよー。」
俺「確かに、確かにねー」
はい、gamellaです。こんにちわ。
というわけで無事卒論書き終わりました。
かなり納得の出来です。
まぁ、興味のある人も少ないでしょうが、ここで詳しくどんな内容か説明すると、要点は、
「遺伝子発現状態のばらつき」についてです。
Elowitzら[1,2]によって、遺伝子発現が増加すると遺伝子発現のばらつきが減少することが示されました。これはどういうことかというと、一般に遺伝子は発現を抑制された状態にあるほうが、その発現量のノイズは大きいということを意味します。で、それをシミュレーションを使って解析したわけです。で、原因は遺伝子が制御に採用しているリプレッサーというシステムがノイズを生み出しているということがシミュレーションによっても示されました。
[1]Elowitz MB, Levine AJ, Siggia ED, Swain PS.(2002);Stochastic gene expression in a single cell.Science. 2002 Aug 16; 297(5584): 1183-6.
[2]Swain PS, Elowitz MB, Siggia ED.(2002);Intrinsic and extrinsic contributions to stochasticity in gene expression.
Proc Natl Acad Sci U S A. 2002 Oct 1; 99(20): 12795-800. Epub 2002 Sep 17.
まぁ、要点だけはなせばこんな感じの内容です。
ここからは、卒論に書いていない感想なのですが、いろいろ思うことはあるわけです。
まず、原核生物は遺伝子制御システムをわざと不完全につまり、工学的に嫌われるノイズフルに作っています。ノイズによって状態の多様性が生み出され、ある程度の状況の変化にも対応できるようになっている、というのが、ここ最近のとりあえずの結論のようですが、DNAという細胞内で最も重要なシステムをノイズフルにするリスクも考えないといけません。
単細胞生物ですから、一つのノイズからシステムが崩壊する可能性もあるわけです。となると、それを避けるためには、上位のレイヤーがノイズの監視機構を持つか、個々が互いを監視する複雑系的な制御が必要になるはずです。しかし、そのようなシステムはとりあえず発見されていません。
となると、そのような最終的な制御のシステムは生存または進化というレイヤーになることになります。つまり、結局そっちの方が有利だから生き残ったという考え方です。
原核生物ならそれで通用しますが、真核生物とくに多細胞生物になるとその考えは通用しなくなります。個々の細胞がノイズフルな事は多細胞生物にとっては致命的です。で、実際にノイズを押さえ込む上位レイヤーにあたるシステムを真核生物は兼ね備えています。つまり、かなり工学的に完全な遺伝子発現制御システムを構築しています。
俺にとってもはこの部分が興味深いです。単細胞生物から真核生物になる過程のなかでもかなり重要なポイントだと思います。
他にもいろいろ思うことはあるのですが、とりあえず今日はここまでです。
追記:
こんなこと書いているうちに、修士のテーマで真核生物の遺伝子発現のノイズの機構についてもモデリングしてやろかなんて、考えちゃいましたが、冷静に考えると、すこい大変なんだろうなあ。
俺「確かに、確かにねー。」
俺「卒論も終わったし書きましょうよー。」
俺「確かに、確かにねー」
はい、gamellaです。こんにちわ。
というわけで無事卒論書き終わりました。
かなり納得の出来です。
まぁ、興味のある人も少ないでしょうが、ここで詳しくどんな内容か説明すると、要点は、
「遺伝子発現状態のばらつき」についてです。
Elowitzら[1,2]によって、遺伝子発現が増加すると遺伝子発現のばらつきが減少することが示されました。これはどういうことかというと、一般に遺伝子は発現を抑制された状態にあるほうが、その発現量のノイズは大きいということを意味します。で、それをシミュレーションを使って解析したわけです。で、原因は遺伝子が制御に採用しているリプレッサーというシステムがノイズを生み出しているということがシミュレーションによっても示されました。
[1]Elowitz MB, Levine AJ, Siggia ED, Swain PS.(2002);Stochastic gene expression in a single cell.Science. 2002 Aug 16; 297(5584): 1183-6.
[2]Swain PS, Elowitz MB, Siggia ED.(2002);Intrinsic and extrinsic contributions to stochasticity in gene expression.
Proc Natl Acad Sci U S A. 2002 Oct 1; 99(20): 12795-800. Epub 2002 Sep 17.
まぁ、要点だけはなせばこんな感じの内容です。
ここからは、卒論に書いていない感想なのですが、いろいろ思うことはあるわけです。
まず、原核生物は遺伝子制御システムをわざと不完全につまり、工学的に嫌われるノイズフルに作っています。ノイズによって状態の多様性が生み出され、ある程度の状況の変化にも対応できるようになっている、というのが、ここ最近のとりあえずの結論のようですが、DNAという細胞内で最も重要なシステムをノイズフルにするリスクも考えないといけません。
単細胞生物ですから、一つのノイズからシステムが崩壊する可能性もあるわけです。となると、それを避けるためには、上位のレイヤーがノイズの監視機構を持つか、個々が互いを監視する複雑系的な制御が必要になるはずです。しかし、そのようなシステムはとりあえず発見されていません。
となると、そのような最終的な制御のシステムは生存または進化というレイヤーになることになります。つまり、結局そっちの方が有利だから生き残ったという考え方です。
原核生物ならそれで通用しますが、真核生物とくに多細胞生物になるとその考えは通用しなくなります。個々の細胞がノイズフルな事は多細胞生物にとっては致命的です。で、実際にノイズを押さえ込む上位レイヤーにあたるシステムを真核生物は兼ね備えています。つまり、かなり工学的に完全な遺伝子発現制御システムを構築しています。
俺にとってもはこの部分が興味深いです。単細胞生物から真核生物になる過程のなかでもかなり重要なポイントだと思います。
他にもいろいろ思うことはあるのですが、とりあえず今日はここまでです。
追記:
こんなこと書いているうちに、修士のテーマで真核生物の遺伝子発現のノイズの機構についてもモデリングしてやろかなんて、考えちゃいましたが、冷静に考えると、すこい大変なんだろうなあ。