东大式 生命データサイエンス即戦力讲座 ゲノム、エピゲノム、トランスクリプトームからシングルセルまで、大规模データ解析で论文を书くための搁&笔测迟丑辞苍ツールボックス
本书は东京大医学大学院新领域研究科が进める生命データサイエンス教育プログラム「顿厂罢贰笔」() におけるバイオプログラミング演習のコンテンツを書籍化したものである。DSTEPは近年のゲノム解析をはじめとする大規模バイオデータに即応できる人材の育成を、製薬企業、バイオテク企業等と連携して行うことを目的に設立されたものである。実際、該当分野における人材の欠乏は深刻である。
初めてのヒトゲノムの完全解読が発表されて20年が経過しようとしている。10年前の次世代シークエンス技术の登場を経て、近年のバイオデータ産生技术の進歩は20年前には想像しなかった速度で進展している。公的/私的なデータベースには何十万人分、何百万人分というヒトゲノムデータがあふれかえる。がんゲノムの精密なシークエンス解析によって検出されたがん原性変異 (ドライバー変異) に依拠して、個々の患者に最適な治療戦略を策定するいわゆる「個別化医療」は実診療として実装、保険収載されるまでになっている。さらに基礎研究の分野ではゲノム解読技术を遺伝子発現解析等の多層オーミクス解析へと転用、さらに近年ではその解析解像は単一細胞 (シングルセル解析) へとまで進化している。さらにこれを発展させる形で、空間情報を保持した形での多層オーミクス解析も行われるようになった。例えばがん細胞における多様ながん進化あるいは免疫細胞との相互作用を解明するために、病理画像データの各スポットでのオーミクス解析が実施されるようになっている。今後もますます大規模データの産生と解析の流れはその速度を増して展開していくと思われる。急速なデータ蓄積を背景にヒトに関する分生生物学的?基礎医学的理解を飛躍的に拡大している。それに呼応する形で、生物学的知見の創出に人工知能を活用しようとする試みも増えている。機械学習の本質が大量に蓄積されたデータの活用にあるのであれば、生物学においても飽和量のデータが大きな転換をもたらす時が来るのかもしれない。少なくともリアルワールドにおいて真にヒトを完全に理解し、さらにはヒトを超える領域まで健康/治療を推進しようとするには、これまでにない規模での生物学的データの産生、その解析の深化は必須の要素である。その未来に向かって実に多くの技术革新が現在も進行中である。ヒトの細胞システムを理解するに足る規模での大規模、精密オーミクス解析が実践されるような未来、本質的な意味での「生命データサイエンスの時代」の到来も迫っているように思う。現在、その黎明期にあって、本書が未来を担う若手研究者への第一歩を後押しするものになれば、と思う。
* 本书は新领域研究科が进める生命データサイエンス教育プログラム「顿厂罢贰笔」におけるバイオプログラミング演习のコンテンツを书籍化したものである。顿厂罢贰笔の贬笔はこちら:
(紹介文執筆者: 新领域创成科学研究科 教授 鈴木 穣 / 2022)
本の目次
第1章 鲍苍颈虫系环境の準备
第2章 データ解析に向けた鲍苍颈虫系环境の使い方
第3章 笔测迟丑辞苍によるデータ解析の基础
第4章 笔测迟丑辞苍によるデータ解析の実践
第5章 R言语によるデータ解析の基礎と実践[1]
第6章 R言语によるデータ解析の実践[2]
第7章 スパコン利用のためのはじめの一歩
第二部 生命データサイエンスの実践
第1章 オミクス解析の準备
第2章 ゲノム解析
第3章 トランスクリプトーム解析
第4章 エピゲノム解析
第5章 シングルセル解析[1]
第6章 シングルセル解析[2]
第7章 ロングリード解析
関连情报
東京大医学大学院新領域研究科 生命データサイエンス教育プログラム「DSTEP」
铃木穣研究室
书籍绍介:
「分子生物学会で大好評 『东大式 生命データサイエンス即戦力讲座』」 (羊土社ウェブサイト 2021年12月9日)
関连记事:
村上善則?鈴木穰「シリーズ連携研究機構第41回 日本のゲノム研究とその活用を推進」 (『学内広報』No. 1553 2021年12月)
/gen03/kouhou/1553/03column.html#%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA%E9%80%A3%E6%90%BA%E7%A0%94%E7%A9%B6%E6%A9%9F%E6%A7%8B
特集「生命データサイエンスセンター」 (『創成』第37号 2021年3月)