塩基配列データベース

生物学

※アイキャッチ画像は、後述のデータベースである、Ensembl(アンサンブル)で、ヒト(Human)とゼブラフィッシュ(Zebrafish)のオプシン遺伝子の類似性やオルソログを示しています。

データベースへのリンクは、【データベース】を参照してください。
塩基配列データベースとして、DDBJ/EMBL/GenBank国際塩基配列データベースがあるが、私はヒトとゼブラフィッシュの視物質遺伝子について知りたい。
この場合、NCBIとZFINに注目すべきで、他のデータベースは意味がないのでしょうか?

≪ChatGPT-5≫
この質問は非常に本質的で、バイオインフォマティクスにおける**データベース選択の重要性**をよく理解しているからこそ出てくるものです。以下に、**NCBIやZFINの重要性**、そして**DDBJ/EMBL/GenBank以外のデータベースの活用価値**について整理して説明します。
✅ 結論:
NCBIとZFINは非常に重要ですが、他のデータベースにも意味はあります。目的に応じて使い分けることが重要です。

### ■ 基本の国際塩基配列データベースとは?

DDBJ(日本)、EMBL-EBI(欧州)、NCBI(米国)は、**国際塩基配列データベース(INSDC)**を構成しており、3者で**相互同期されたデータ**を扱っています。

* **どれを使っても基本的に同じ配列情報が得られます。**
* アクセッション番号(例:NM\_001256789)は共通。

つまり、**配列データそのもの**を得る目的であれば、どのサイトを使っても構いません。

### ■ NCBIとZFINの役割

#### ◎ NCBI(National Center for Biotechnology Information)

* 配列、遺伝子、タンパク質、構造、文献など、**統合された生物学情報が豊富**。
* BLASTやGene、RefSeq、PubMedとの連携が強力。
* ゼブラフィッシュの遺伝子情報も多く収録。

#### ◎ ZFIN(Zebrafish Information Network)

* **ゼブラフィッシュ専門のモデル生物データベース**。
* ゼブラフィッシュの視物質(opsinなど)に関しては、**発現部位・発生段階・変異体**など、**文献情報を含む詳細なアノテーション**が強い。
* NCBIより**ゼブラフィッシュに特化した機能情報**にアクセスしやすい。

### ■ 他のデータベースは意味がないのか?

**意味がないわけではありません**。目的次第で非常に有効です。

#### ◉ Ensembl([https://www.ensembl.org/)](https://www.ensembl.org/))

* **ゲノムブラウザ**として、ヒト・ゼブラフィッシュ両方の遺伝子構造・転写バリアントを比較するのに最適。
* ゲノム上の位置情報やイントロン・エクソン構造の可視化に優れる。

#### ◉ UCSC Genome Browser([https://genome.ucsc.edu/)](https://genome.ucsc.edu/))

* エピゲノム、トランスクリプトーム、比較ゲノム解析に役立つ。
* 少しヒト寄りの傾向だが、ゼブラフィッシュも対応。

#### ◉ UniProt([https://www.uniprot.org/)](https://www.uniprot.org/))

* 視物質遺伝子の**タンパク質情報・機能アノテーション**が充実。
* 発現情報や構造、オルソログ、パスウェイ解析に役立つ。

#### ◉ KEGG([https://www.genome.jp/kegg/)](https://www.genome.jp/kegg/))

* Opsinが関与する視覚シグナル伝達経路の理解に有用。
* 遺伝子産物がどのような代謝・情報伝達経路に関与しているかを視覚的に確認できる。

👁️ 視物質遺伝子(Opsin)を調べる際の流れ例

1. 遺伝子情報の基本を把握
NCBI Gene(ヒト・ゼブラフィッシュの opsin 遺伝子名を確認)

RefSeq配列(mRNA、タンパク質)を取得

2. ゼブラフィッシュ特有の知見を深める
ZFIN:遺伝子発現のタイミング、変異体、論文へのリンク

3. タンパク質構造や機能の理解
UniProt:視物質タンパク質のドメインや発現部位

4. 配列比較・進化的解析
NCBI BLAST:ヒトとゼブラフィッシュで相同性検索

Ensembl compara:オルソログ/パラログを系統樹で比較

5. シグナル伝達経路への統合
KEGG:視覚経路でどこに opsin が関与しているか

💡補足:なぜZFINが重要なのか?
ZFINでは、ゼブラフィッシュの視覚遺伝子に関する特化情報が得られます。

例:
opn1sw1(short wavelength opsin)や opn1mw1 など、ヒトとの相同遺伝子
発生段階における発現データ(ISHやRNA-seq)
モデル変異体の表現型(行動異常など)

■ まとめ:目的に応じたデータベース選択の重要性
ヒトとゼブラフィッシュの視物質遺伝子を調べるには、以下のように役割ごとにデータベースを使い分けることが最適です。

目的                   推奨データベース
塩基配列の取得 DDBJ / NCBI / EMBL
遺伝子全体の情報(RefSeq、BLAST、文献) NCBI
ゼブラフィッシュ特有の機能・発現情報 ZFIN
ゲノム構造の可視化と比較 Ensembl / UCSC
タンパク質構造と機能 UniProt
遺伝子の経路解析 KEGG

🎯 あなたの目的に応じたベスト選択
目的                 ベストデータベース
塩基配列やアミノ酸配列の取得     NCBI / Ensembl
ゼブラフィッシュ特有の視物質遺伝子の探索 ZFIN
ゼブラフィッシュとヒトの遺伝子の比較 Ensembl(Comparative genomics)
タンパク質の詳細情報(分類・機能)  UniProt
論文や過去の研究とのリンク      NCBI / ZFIN

🔧 具体例:ゼブラフィッシュのred opsin遺伝子を調べたい

ZFINで「opsin」や「opn1lw」などで検索
→ opn1lw1, opn1lw2 など複数見つかる
→ 発現部位、変異情報、NCBIリンクあり

NCBI Geneで Danio rerio opn1lw1 検索
→ 塩基配列やRefSeq、アミノ酸配列取得

Ensemblで opn1lw1 のエクソン構造、進化的保存性をチェック

✅ まとめ

NCBI と ZFIN を中心にするのは 正解。
しかし:
Ensembl:ゲノム比較・遺伝子構造の視覚化
UniProt:タンパク質レベルでの機能理解
UCSC:ゲノムブラウザでの可視化
なども、補助的に使うと非常に有益です。

Ensemblで、ゼブラフィッシュとヒトの遺伝子の比較をする方法を教えて下さい。

≪ChatGPT-5≫
Ensemblでゼブラフィッシュ(Danio rerio)とヒト(Homo sapiens)の遺伝子を比較する方法は、主に「**Orthologues(オルソログ=直系遺伝子)」情報を利用します。

以下に、Ensembl公式サイト上での具体的な手順をわかりやすく説明します。

🔍【ステップバイステップ】Ensemblでゼブラフィッシュとヒトの遺伝子を比較する方法
✅ ステップ1:Ensemblにアクセス
🔗 Ensembl(https://www.ensembl.org)

✅ ステップ2:調べたい遺伝子を検索
画面上部の検索窓に、たとえば以下のように入力してEnter:
opn1lw(例:ヒトのlong-wavelength opsin 遺伝子)
または opn1lw1 danio rerio(ゼブラフィッシュの対応遺伝子)

✅ ステップ3:Geneページに入る
検索結果から、目的の遺伝子(種と遺伝子名が一致)をクリックします。
→ Gene summary ページが表示されます。

✅ ステップ4:「Orthologues(オルソログ)」を確認
左メニューまたは下部メニューに「Orthologues」というリンクがあります。
クリックすると、**その遺伝子の他種でのオルソログ(相同遺伝子)**が一覧表示されます。
Homo sapiens(ヒト)を探して比較可能
各オルソログの「%ID(類似度)」や「E-value」なども表示される

✅ ステップ5:比較対象の遺伝子に移動
ヒトのオルソログがリストに表示されたら、その遺伝子名をクリックすることで、ヒト側のGeneページにジャンプできます。
ヒトとゼブラフィッシュの配列比較
エクソン構造の比較
タンパク質の保存性 などが可能

🧪 応用:配列のアラインメントを見る
「Gene tree」機能や「Protein alignment」を使うことで、複数種の配列(アミノ酸やcDNA)の進化的比較が視覚的に確認できます。

🧭 例:ゼブラフィッシュの opn1lw1 を調べる場合
Ensemblで opn1lw1 danio rerio を検索
Geneページで「Orthologues」を開く
Homo sapiens のオルソログが OPN1LW として表示される
配列の類似性(%ID)やタンパク質比較ができる

🔧 補足Tips
Ensemblには「BioMart」という高機能なデータ抽出ツールもあり、大量のオルソログを一括取得できます(必要なら解説可能)。
同様の比較は NCBIのGeneページやBLAST でも可能ですが、Ensemblは視覚的に比較しやすいのが利点です。

Orthologues リンクが見当たりません。

≪ChatGPT-5≫
EnsemblのGeneページで「Orthologues」リンクが見当たらない場合、いくつかの原因と対処法があります。順を追ってチェックしてみましょう。

1. Ensemblの表示言語やレイアウトの違いを確認
Ensemblは頻繁にUIが更新されます。
「Orthologues」は旧UIでは左メニューにありましたが、今はタブやセクションにまとめられていることが多いです。

2. Orthologues情報を見る手順の具体例
① 遺伝子ページで「Gene」タブを確認
遺伝子ページに入ると、「Summary」「Gene」「Transcript」「Variation」などのタブがあります。
「Gene」タブ(遺伝子の基本情報)に移動してください。

② 「Orthologues」セクションを探す
「Gene」タブの中で、スクロールすると「Orthologues」や「Homologues」関連のセクションがあります。
「Orthologues」は「Orthologues」や「Orthologs」と表記されている場合もあります。

③ もし見当たらない場合
ページ上部の「Comparative Genomics」や「Gene Tree」へのリンクを探す
「Gene Tree」を開くと、その遺伝子の系統樹が表示され、オルソログ情報が含まれています。

OPN1LW. Human と opn1lw2, Zebrafish が赤く表示されています。どういう意味ですか?

≪ChatGPT-5≫
EnsemblのGeneページで「OPN1LW (Human)」と「opn1lw2 (Zebrafish)」が赤く表示されている場合、それは主に以下のような意味があります。

1. 赤色表示の意味
Ensemblのページで遺伝子名やオルソログ名が赤く表示されることは、
「その遺伝子が現在注目されている(選択されている)」「リンクが有効」 または
**「強調表示されている」**場合が多いです。

具体的には
赤色は「クリック可能なリンク」であることを示す(普通の青リンクと区別される場合もある)
または、オルソログ(相同遺伝子)として強調表示されている

2. 「OPN1LW (Human)」と「opn1lw2 (Zebrafish)」の関係
これらは ヒトのOPN1LW遺伝子とゼブラフィッシュのopn1lw2遺伝子が相同(オルソログ)であることを示しています。

ゼブラフィッシュはゲノムの一部重複イベントがあるため、
ヒトの1つの遺伝子に対してゼブラフィッシュでは複数のオルソログ(paralogsに近い場合もある)が存在することがあります。

例えば
opn1lw1
opn1lw2
のように2つ以上の類似遺伝子が見つかる場合があります。

3. なぜ赤色で示されるのか
Ensemblの遺伝子比較ツールや系統樹ページで、
対象の遺伝子と最も密接に関連するオルソログを赤色で表示することで
ユーザーが比較対象の遺伝子を直感的に分かるようにしている場合があります。

4. まとめ
表示色 意味(Ensemblでの推測)
赤色 強調表示/選択された遺伝子/クリック可能なリンクであることが多い。
オルソログとしての関連を示すことも。
通常青色 通常のハイパーリンク

OPN1LW. Human に対して opn1lw2, Zebrafish が赤くなって、opn1lw1, Zebrafish が黒の表示ということは、opn1lw2, Zebrafish が相同遺伝子と理解して良いのですか?

≪ChatGPT-5≫
はい、あなたの解釈はほぼ正しいですが、少し補足が必要です。

✅【結論】
Ensemblで 「OPN1LW (Human)」に対して「opn1lw2 (Zebrafish)」が赤く表示され、
「opn1lw1」は黒で表示されている場合:

👉 Ensemblが “主なオルソログ”(最も相同性が高い、または系統的に近い)と判定しているのは opn1lw2 である
という意味で理解して差し支えありません。

🧬 補足説明:ゼブラフィッシュとヒトのオルソログ関係
🔹 オルソログとは?
共通祖先から分岐した後も、種の間で基本的な機能が保存されている遺伝子のこと。

Ensemblでは、種間で最も近いオルソログ(1対1、1対多、多対多)を推定しています。

🔎 なぜ opn1lw2 が赤、opn1lw1 が黒?
Ensemblは:

ゼブラフィッシュの opn1lw1 と opn1lw2 の両方を ヒトの OPN1LW のオルソログとして認識しています。

そのうち、**より高い類似性(例:アミノ酸配列の相同性、ドメイン構造、エクソン構成など)**を持つ方を「主なオルソログ(primary ortholog)」として赤く表示します。

🔍 例:Ensembl Gene Treeでの状況
OPN1LW (Homo sapiens)
└── opn1lw2 (Danio rerio) ← 赤(より近い、主なオルソログ)
└── opn1lw1 (Danio rerio) ← 黒(副次的オルソログ、またはパラログに近い)

🧪 推奨アクション
「opn1lw2」がヒトOPN1LWの主なオルソログとされているが、
「opn1lw1」も機能的には関連している可能性があるので、両方チェックするのが理想です。

機能解析や発現パターンの文献もあわせて調べると理解が深まります。

📌 まとめ
ゼブラフィッシュの遺伝子 Ensemblでの表示 意味
opn1lw2 赤 主なオルソログ(OPN1LWと最も近縁)
opn1lw1 黒 副次的オルソログ、またはパラログに近い

私は視物質遺伝子の相同性・特異性を調べたいと思っています。
そもそも、ゼブラフィッシュとヒトの視物質遺伝子を1対1で比較しようとすることに無理があるのでしょうか?
それとも、今回のように、OPN1LW. Human と opn1lw2, Zebrafish に注目していけばいいのでしょうか?

≪ChatGPT-5≫
ゼブラフィッシュとヒトの視物質(opsin)遺伝子を「必ず1対1で比較する」ことはしばしば無理があるが、opn1lw2 を中心に注目するのは妥当です。ただし opn1lw1 も無視せず、複数の証拠(配列、系統、シンタニー、発現、機能残存)で判断するのが安全です。

以下、理由と**実務的な進め方(チェックリスト+具体手順)**をまとめます。

なぜ「1対1比較」が難しいのか(背景)
魚類(テレオスト)特有の全ゲノム重複(TGD / fish-specific genome duplication)

ゼブラフィッシュは進化の過程でゲノムが一度重複しているため、ヒトの単一遺伝子に対してゼブラフィッシュでは**2個以上の相同性遺伝子(オルソログ/パラログ混在)**が存在することが多い。

その結果、ヒト:ゼブラフィッシュは1対多や多対多の関係が常態です。

遺伝子重複後の機能分化(ネオ/サブファンクショナル化)

重複後、片方は発現パターンや機能が変わる(部分的に失う/新しく得る)ことがあるため、単純な1:1比較では機能の違いを見落とす。

命名とアノテーションの差

EnsemblやZFINが「主なオルソログ」を1つ赤で示すことがあるが、それは「最も近縁(primary ortholog)と自動判定した」だけで、機能的同等性を完全に保証するわけではありません。

実務:どのように比較を進めるべきか(ステップ/チェックリスト)
1) Ensembl の Gene tree / Orthologues をまず見る(素早いスクリーニング)
OPN1LW (Homo sapiens) の Gene ページ → Gene tree を開く。

opn1lw2 が「主たるオルソログ」として示されているなら、最初の注目先としてOK。

ただし tree 上で opn1lw1 も近縁にあれば、両方を候補にして次に進む。

2) 相同性(配列)比較:タンパク質アラインメントと%identity
ヒト OPN1LW と Zebrafish の opn1lw2 / opn1lw1 の アミノ酸配列を取得(Ensembl/NCBI/UniProt)。

MAFFT / Clustal Omega 等でアラインメント→ % identity と保存残基を確認。

目安:高い%ID(>70%)なら構造・機能保存の可能性が高い。だが視物質は鍵残基で分光特性が変わるので注意。

コマンド例(ローカル)

bash
コピーする
編集する
mafft –auto sequences.fasta > aligned.fasta
# その後 alignment を確認(例えば Aliview)
3) 逆相互最良ヒット(Reciprocal Best Hit; RBH)で確認
ヒトの OPN1LW をゼブラフィッシュゲノムに BLAST し、得られたトップを取り、それを再びヒトに BLAST。

トップが相互一致すれば「RBH」で強いオルソログ証拠になります。

コマンド例(ncbi-blast)

bash
コピーする
編集する
blastp -query human_OPN1LW.fasta -db danio_proteins.fasta -outfmt 6 -max_target_seqs 5
4) シンタニー(遺伝子周辺の保存)を確認
Ensembl の Region/Comparative view でヒトとゼブラフィッシュの周辺遺伝子の保存(synteny)を見る。

周辺遺伝子の並びが保存されていればオルソログである強い証拠になります。

5) 機能的証拠:発現パターンと実験データ
ZFIN(ゼブラフィッシュ特化)で opn1lw1/opn1lw2 の発現部位・時期、変異表現型を確認。

ヒト側は GTEx / Human Protein Atlas 等で網膜発現を確認。

発現が似ているかどうかで機能保存の判断材料になります。

6) 重要残基(spectral tuning sites)を確認
視物質(opsin)はごく少数のアミノ酸残基の違いで吸収スペクトルが変わります。

既知のスペクトルチューニング残基(文献に依る)をアラインメントでチェック。重要残基が保存されているかで機能的近さを推定できます。

注意:残基の番号は種や配列によってずれるので、常にアラインメント上で相対位置を確認してください。

7) 系統解析で最終確認(必要なら)
複数種(ヒト・ゼブラフィッシュ2個体・他の魚類・両生類・鳥類など)の配列を集めて**系統樹(IQ-TREE, RAxML など)**を作成し、系統位置を評価。

bootstrap が高ければ信頼度は高いです。

コマンド例(IQ-TREE)

bash
コピーする
編集する
iqtree -s aligned.fasta -m MFP -bb 1000 -nt AUTO
実際の判断方針(要約)
短い答え:opn1lw2 に注目して解析を進めるのは妥当。だが opn1lw1 も候補なので、両方を比較検討し、上記の複数証拠(配列類似、RBH、シンタニー、発現、重要残基、系統)でどちらが機能的に近いかを決めるのが正しい流れ。

1対1比較を強引に行うのは避ける。代わりに「どのゼブラフィッシュ遺伝子がヒト OPN1LW の最も近い機能的代替か」を判定する手順を踏む。

手元でやってみたいですか?(私がサポートできること)
もしよければ、あなたの代わりに以下を実行して詳しく報告できます(どれでもOK):

  1. Ensembl の Gene tree と synteny を見ての簡易解説(スクリーンショット+解釈)
  2. ヒト OPN1LW と zebrafish opn1lw1/opn1lw2 の アミノ酸アラインメント と % identity を示す(配列を私が取得して解析)
  3. RBH(BLAST)と系統樹の簡易解析(ツールコマンドも提示)
  4. スペクトルチューニング残基の比較(既知残基について突き合わせ)

まず (2)アラインメントと%IDの解析を行うのが実利的です。

塩基配列データベースについて、かなりの情報を得られました。
一旦、このページを終えたいと思います。

タイトルとURLをコピーしました