selamat datang di blog saya

semoga anda mendapatkan apa yang anda butuhkan disini

Rabu, 04 Januari 2012

AQUACULTURE BIOINFORMATIC soal UAS mata kuliah Teknologi Informasi


Nama               :  Adhika Widya Putra
NIM                :  26010210110025
Prog. Studi      :  Budidaya Perairan

Assalamualaikum warrahmatullahi wabarakaatuh,
Dalam kesempatan kali ini saya memasukan posting pada webblog sebagai jawaban dari soal Ujian Akhir Semester bapak Ristiawan Agung, S. Pi tentang ringkasan artikel atau jurnal pada portal undip dengan tema AQUACULTURE BIOINFORMATIC. Berikut artikel yang akan saya ringkas
Sumber Daya Genomik untuk komersialisasi flathfish, Senegal sole
(Solea senegalensis): EST sequencing, oligo desain microarray, dan
pengembangan platform bioinformatic Soleamold
(jurnal dapat dilihat disini)
Ringkasan :
Senegal sole (Solea senegalensis) adalah flatfish yang berharga tinggi untuk kebutuhan komersialisasi di bidang perikanan Eropa bagian Selatan. Flatfish, anggota dari ordo Pleuronectiformes, adalah kelompok teleosts yang relatif besar dengan sekitar 570 spesies yang bias ditemukan. Ikan perairan benthik dan karnivora, kebanyakan adalah spesies laut dan hanya sekitar 4 spesies air tawar yang mengalami proses perkembangan yang unik dengan metamorphosis dimana mata berada di salah satu bagian tubuh dan bagian tubuh lainya rata tanpa adanya mata (flat). Flatfish telah lama dikenal sebagai pilihan dari berbagai makanan laut, dari berbagai macam kelompok (halibut, turbot, plaice) yang penting bagi perikanan komersial. Dengan keluarnya peraturan umum di seluruh dunia dalam perikanan liar, masalah penangkapan untuk menjaga kestabilitasisasi habitat liar dari flatfish, membudidayakan flatfish telah menjadi jawaban selama 15-20 tahun ini. Namun, industri produksi ikan ini di Senegal terhambat terutama oleh kurangnya informasi tentang fisiologis ikan tersebut mekanisme yang terlibat dalam reproduksi, pertumbuhan dan kekebalan, informasi genom yang sangat terbatas pada spesies ini menyebabkan industri di daerah ini kurang berkembang. Padahal dalam beberapa tahun terakhir, penelitian laboratorium genomik telah menemukan kontribusi mekanisme perkembangan vertebrata dan telah menjelaskan fenomena evolusi seperti genom duplikasi dan menciptakan gen duplikat. Hal ini telah dipraktekan pada ikan Zebra (Danio rerio), Medaka (Oryza latipes), dan Buntal (Tetraodon nigroviridis) dan dalam jurnal ini akan dipraktekan pada ikan Senegal sole (Solea senegalensis).
Proyek ini telah mengembangkan alat riset genomic dan proteomika (bio-informatika) untuk membantu mencapai tujuan ini. Dilaporkan pembentukan dari database EST untuk Senegal sole mengandung 5.087 urutan cDNA, dan konstruksi validasi dari oligo microarray berbasis deteksi dari 5.087 diduga transkrip dari spesies ini. Selain itu, sebuah plattfrom interaktif bio-informatika yang disebut SOLEAMOLD dikembangkan untuk mengakomodasi database EST dan hasil dari microarray dan hibridasi in situ. Sepuluh non-normalisasi, terarah-kloning cDNA dibangun dari berbagai jaringan dewasa dan tahap larva. Presentase klon dengan sisipan (efisiensi rekombinan) adalah tinggi sekitar 97-98 % dengan ukuran rata-rata masukan 0,9-1,7 kb. Untuk meminimalkan redundansi sebelum sekuensing, alikuot perpustakaan masing-masing, tergantung pada titer setelah satu putaran amplifikasi, yang dikumpulkan menjadi sebuah perpustakaan induk, yang dinormalkan melalui tiga putaran hibridisasi. Tentang 10.400 klon dari induk perpustakaan disekuensing dengan T7 primer untuk urutan sesuai dengan UTR 3 'dengan benar berorientasi sisipan. Karena konservasi rendah umum di UTRs 3 ', dan duplikasi genom peristiwa yang telah terjadi di teleosts, kami berfokus pada 3 'sekuensing untuk oligos desain khusus untuk microarray untuk membedakan antara paralogues potensial yang timbul dari duplikasi gen. Setelah pemangkasan dan vektor dan kontaminan penghapusan, 10.185 berkualitas tinggi urutan yang diperoleh dengan panjang membaca rata-rata sekitar 600-700 pb, dengan mayoritas yang membaca> 700 bp . Urutan ini telah diserahkan ke GenBank (aksesi nomor: FF281814-FF291996).
Telah dikembangkan microarray oligonukleotida untuk studi pada ekspresi gen S. senegalensis diberikan reproduktifitas lebih besar dari data yang dikumpulkan dengan oligonukleotida sebagai pengurai cDNA melihat Tethys, yang mendesain tools (perangkat lunak bio-Informatika) berpemilik oligonukleotida digunakan untuk meracang suatu microarray berdasarkan EST yang diurutkan. Seperti prosedur pembelahan mRNA seperti protocol Eberwein adalah bias terhadap 3 polia ekor transkrip, oligo disesain sam sama bias menuju ujung 3 sequences. Khusus untuk 50-60 probe oligonukleotida berhasil dirancang untuk 5.082 dari 5.087 unigen dirakit dari EST. dirancang pula probe untuk control mRNA ked ala campuran masing0masing sebelum di hibridisasi, untuk kontrol kualitas dan pemantauan dan data pengolahan. Desain akhir dari setiap slide, Solea senegalensis telah berhasil dikloning yang terdiri dari 2 array dengan probe gen spesifik untuk semua 5.087 uni gen serta oligos control negative dan positif.

Selasa, 03 Januari 2012

Perkembangan Budidaya Perairan dengan Bantuan Bio-Informatika


PENERAPAN BIO-INFORMATIKA DALAM BUDIDAYA PERAIRAN
TOLERANSI SALINITAS PADA IKAN NILA DENGAN PENERAPAN REKAYASA GENETIK

    Peranan bioinformatika dalam bidang budidaya dapat membantu perkembangan dunia perikanan khususnya dalam bidang pemuliaan genetika, rekayasa genetika untuk membuat penguat sistem imunitas atau pembuatan kultifan transgenetik yang memiliki kelebihan yaitu memiliki kemampuan bertahan terhadap berbagai serangan penyakit akibat virus ataupun mikroorganisme pathogen yang dapat  menyebabkan kematian pada biota budidaya yang di hasilkan dari penyisipan gen asing yang membawa sifat unggul. Dalam jurnal toleransi salinitas pada ikan Nila (Oreochromis niloticus) diperkenalkan DNA asing pada gonad ikan sebagai tindak penelitian terhadap ketahanan salinitas. Akibat penurunan kualitas genetic berbagai biota budidaya yang disebabkan oleh penyilang  tanpa mengetahui  seluk beluk induknya ataupun pemakaian berbagai bahan kimiawi yang tidak jelas komposisinya berdampak terhadap penurunan kondisi genetic organisme budidaya sehingga rentan terhadap berbagai serangan penyakit.
Namun berkat teknologi (BIO-INFORMATIKA) yang ada pada saat ini, kultivan kultivan tersebut telah mengalami pemurnian gen ataupun penyisipan DNA donor yang sekarang telah didapatkan kultivan yang unggul. Hasil penelitian ini konsisten dengan temuan ini, rata-rata nilai tertinggi dari berat badan akhir (FBW), mendapatkan harian (DG) dan SGR dicatat oleh genetic dimodifikasi O. niloticus diobati dengan laut bream-DNA dan catatan ini secara signifikan lebih tinggi (P ≤ 0,05) dibandingkan dari rekayasa genetika niloticus diobati dengan Artemia-DNA dan ikan kontrol. Dalam semua kelompok ikan, nilai rata-rata tertinggi FBW, DG dan SGR yang diperoleh untuk ikan dibesarkan hingga 16 ppt dan berbeda secara signifikan (P ≤ 0,05) dari orang-ikan dipelihara di 32 ppt. Umumnya pertumbuhan ikan Nila pada salinitas 32 tersebut menurun namun dengan aplikasi DNA tersebut ikan Nila dapat tumbuh sama baiknya dengan ikan Nila yang dibudidayakan dengan salinitas optimal. Bio-Informatika disini berperan dalam transfer genetik, dengan kalkulasi sistem komputasional sehingga dapat memprediksikan kemungkinan-kemungkinan yang terjadi apabila beberapa sekuen DNA disatukan.
Untuk melihat artikel silahkan klik disini.

Jumat, 16 Desember 2011

Analisis Penerapan SIG dan Inderaja


Sistem Informasi Geografis (SIG) dan Penginderaan Jauh (Inderaja)

Assalamualaikum,
Dapet tugas nih gan buat nganalisis jurnal tentang penerapan Sistem Informasi Geografis dan Penginderaan jauh atau yang biasa dikenal dengan SIG, dan Inderaja. Apakah SIG dan Inderaja itu? Menurut Bernhardsen (2002) SIG sebagai sistem komputer yang digunakan untuk memanipulasi data geografi. Sistem ini diimplementasikan dengan perangkat keras dan perangkat lunak komputer yang berfungsi untuk akusisi dan verifikasi data, kompilasi data, penyimpanan data, perubahan dan pembaharuan data, manajemen dan pertukaran data, manipulasi data, pemanggilan dan presentasi data serta analisa data. Inderaja atau penginderaan jauh sendiri berarti berbagai teknik yang dikembangkan untuk perolehan dan analisis informasi tentang bumi atau upaya untuk memperoleh, menunjukkan (mengidentifikasi) dan menganalisis objek dengan sensor pada posisi pengamatan daerah kajian (Lindgren dan Avery, 1985). Nah, ini dia jurnal yang mau ane analisis, monggo dilihat disini.
Analisa dilihat dari pembahasan jurnal tersebut adalah di beberapa wilayah Indonesia pengelolaan perikanan tangkap skala kecil sudah dilakukan secara tradisional oleh masyarakat setempat dan juga dilakukan secara partisipatif antara masyarakat nelayan dengan beberapa unsur lain yang terlibat (stakeholders) termasuk pemerintah. Kekurangan dari pengelolaan tersebut adalah formulasinya kurang didukung oleh informasi ilmiah yang akurat. Dengan kemajuan ilmu pengetahuan dan teknologi saat ini, informasi terutama yang terkait dengan daerah penangkapan ikan yang potensial dan status sumber daya pesisir lainya sudah dapat ditentukan. Jurnal tersebut menguraikan peranan penginderaan jauh dan sistem informasi geografis (SIG) dalam pengelolaansumberdaya pesisir khususnya yang berkaitan dengan perikanan tangkap skala kecil secara berkelanjutan.
            Sebagaimana isi jurnal, aktifitas penangkapan dan hasil tangkapan nelayan skala kecil bergantung pada 3 ekosistem utama pesisir; mangrove, padang lamun, dan terumbu karang. Fungsi dari penginderaan jauh dan SIG disini adalah memberikan informasi lengkap mengenai status sumberdaya guna menjaga kontinuitas keperluan pengelolaan. Data warna laut memberikan informasi ketersediaan makanan dalam kolom air, suhu permukaan air laut (SPL) menggambarkan lingkungan laut. Dari kandungan klorofil (warna hijau pada perairan) dan suhu permukaan air laut yang didapatkan dari Ocean Color Monitor (OCM) dan NOAA AVHRR diintegrasikan dan dipergunakan untuk prakiraan perikanan untuk memperoleh keberadaan ikan secara lebih akurat. Telah diamati bahwa boundaries dari klorofil dan SPL merupakan lokasiideal bagi berkumpulnya ikan. Lokasi-lokasi tersebut merupakan indikasi terjadinya penggabungan antara proses biologis dan fisik, dan oleh karena itu ikan cenderung berkumpul.
            Peranan inderaja dalam memprediksi penurunan tangkapan di perairan laut dunia, pada masa yang akan terkait pada peningkatan temperature telah diinvestigasi. Satu variabel kunci di dalam melakukan pengembangan budidaya perairan dan perikanan berkelanjutan adalah kualitas air. Teknologi SIG dan Inderaja menghadirkan alat penting yang dapat digunakan untuk menilai secara tepat pengukuran kualitas air, membuat data dasar, memadukan informasi, memvisualisasikan skenario dan memecahkan permasalahan lingkungan yang rumit (kompleks). Dalam hal ini apabila potensi perikanan di suatu wilayah mulai berkurang maka dengan tampilan dari SIG atau Inderaja dapat langsung diketahui sehingga dapat dilakukan tindakan pencegahan sebelum over ekspoitasi terjadi dan memindahkan area tangkap ke daerah lain.
            Kesimpulan dari analisa jurnal “Penggunaan Penginderaan Jauh dan Sistem Informasi Geografis dalam Pengelolaan Perikanan Tangkap Skala Kecil Berkelanjutan” adalah diketahui SIG dan Inderaja adalah teknologi baru yang dapat membantu dalam kontinutas pengelolaan perikanan tangkap. Penggambaran SIG dan Inderaja dimanfaatkan untuk menghentikan penangkapan pada suatu daerah sebelum terjadi overeksploitasi dan memindahkan daerah tangkap ke daerah yang masih subur lainya. SIG dan Inderaja juga memberi gambaran terhadap perubahan ekosistem mangrove, padang lamun, dan terumbu karang dimana 3 ekosistem tersebut mempengaruhi stabilitas perikanan pesisir.
Sumber : http://isjd.pdii.lipi.go.id/admin/jurnal/101091723.pdf
              http://id.wikipedia.org/wiki/Sistem_informasi_geografis
              http://id.wikipedia.org/wiki/Penginderaan_jauh

Minggu, 20 November 2011

Bio-Informatika


Hallo agan semua . . .
            Ini adalah lanjutan dari tugas kuliah TI Universitas ane tercinta Universitas Diponegoro jurusan kesayangan Budidaya Perikanan, Fakultas Ilmu Perikanan dan Kelautan. Sesuai jarkom yang beredar dengan bunyi, ”Tugas TI, cari artikel bio- Informatika di dunia budidaya 5 tahun terakhir dan buat ringkasanya”. Maka ane dengan sekuat tenaga (lebay bgt sumpah, bikin aja nebeng leptop ma modem temen! haha) mempersembahkan artikel tentang ACTINOMYCETES LAUT .

Kesimpulan ane atau resume ane terhadap artikel tersebut adalah sebagai berikut (serius mode on), Bioinformatika dalam arti harfiah terdiri dari 2 unsur kata yaitu bio yang menjurus kepada biologi, dan informatika atau informasi. Dalam arti kasar bioinformatika adalah informasi mengenai biologi / makhluk hidup, namun arti bio informatika menurut ilmu Teknologi Informasi adalah disiplin ilmu dari perpaduan bio : biologi molekuler, dan informatika : ilmu komputasional seperti matematika, statistik, perhitungan komputerisasi lainya. Dengan penjelasan itu bisa diartikan bioinformatika adalah teknologi informasi yang bertujuan untuk memecahkan masalah daripada biologi molekuler. Menurut kesimpulan artikel tersebut, “Telah diperoleh 9 isolat Actinomycetes laut yang memiliki toksisitas terhadap sel kanker paru-paru A549. Isolat RS02-085 merupakan isolat yang paling tinggi toksisitasnya terhadap sel kanker A549. Hasil identifikasi menggunakan 16S rRNA menunjukkan bahwa isolat RS02-85 memiliki kemiripan dengan Streptomyces tsukubaensis 98%. Hasil studi lebih lanjut menunjukkan bahwa senyawa aktif yangdihasilkan oleh isolat RS02-085 diduga adalah citropeptin dengan rumus molekul C50 H82 N8 O15, bobot molekul sebesar 1036,0 g/mol, dengan serapan panjang gelombang maksimum sebesar 240nm.
Artikel tersbut mendapatkan kesimpulan seperti itu melihat kepada hasil percobaan yang telah dilakukan seperti uji Kromatogram HPLC ekstrak supernatan isolat RS02-085, uji Serapan panjang gelombang maksimum senyawa aktif yang dihasilkan oleh isolat RS02-85, Spektrum 1 HNMR senyawa aktif yang dihasilkan oleh isolat RS02-085 dan struktur molekul senyawa aktif yang dihasilkan oleh isolat RS02-085. Dalam uji uji ini sebenarnya tidak dilakukan percobaan yang sebenarnya, atau paling tidak hanya menggunakan sampel sebagai contoh dari uji yang hendak dilakukan. Tindakan yang dilakukan untuk mengganti uji tersebut digantikan dengan proses komputasi dengan menggunakan bioinformatika. Untuk mencocokan unsur unsur yang ada dalam actinomycetes dan pengaruhnya terhadap sel sel kanker paru paru. Teknik komputasi ini memberi hasil yang lebih valid, karena dapat menghitung dengan lebih detail dan kuantitas lebih banyak daripada manual.
Jadi inti dari bio-informatika di bidang budidaya adalah penggabungan dari budidaya dan bio-informatika. Dalam bidang budidaya artikel tersebut dapat mengarahkan pembudidaya untuk memproduksi actinomycetes lebih baik lagi karena actinomycetes berguna untuk metabolit yang aktif untuk kanker paru paru, dan bio-informatika disini membantu dalam menguatkan pernyataan tersebut. Bio-informatika memadukan hasil dari pengaruh unsur unsur dalam actinomycetes atau biomolekul-nya dengan sel sel kanker melalui proses komputasi.

Senin, 14 November 2011

NCBI

Bioinformatika: Sebuah Panduan Praktis untuk Analisis Gen dan Protein, Edisi Kedua Andreas D. Baxevanis, B. Francis F. Ouellette Copyright _ 2001 John Wiley & Sons, Inc ISBN: 0-471-38390-2 (Hardback); 0-471-38391-0 (Kertas); 0-471-22392-1 (Elektronik) THE NCBI DATA MODEL James M. Ostell Nasional Pusat Informasi Bioteknologi National Library of Medicine Institut Kesehatan Nasional Bethesda, Maryland Sarah J. Wheelan Departemen Biologi Molekuler dan Genetika Johns Hopkins School of Medicine Baltimore, Maryland Jonathan A. Kans Nasional Pusat Informasi Bioteknologi National Library of Medicine Institut Kesehatan Nasional Bethesda, Maryland PENDAHULUAN Mengapa Gunakan Data Model? Kebanyakan ahli biologi akrab dengan penggunaan model hewan untuk mempelajari penyakit manusia. Meskipun penyakit yang terjadi pada manusia mungkin tidak ditemukan dalam persis sama bentuk pada hewan, sering berbagi penyakit hewan yang cukup atribut dengan manusia mitra untuk memungkinkan data yang dikumpulkan pada penyakit hewan yang akan digunakan untuk membuat kesimpulan tentang proses pada manusia. Matematika model menggambarkan kekuatan yang terlibatdalam gerakan muskuloskeletal dapat dibangun dengan membayangkan bahwa otot adalah kombinasi pegas dan piston hidrolik dan tulang lengan tuas, dan, sering kali, 20 THE NCBI DATA MODEL Model tersebut memungkinkan prediksi yang bermakna yang akan dibuat dan diuji tentang jelas jauh lebih kompleks biologis sistem di bawah pertimbangan. Lebih erat dan model elegan mengikuti fenomena nyata, semakin berguna dalam memprediksi atau memahami fenomena alam itu dimaksudkan untuk meniru. Dalam nada yang sama, sekitar 12 tahun lalu, Pusat Nasional untuk Bioteknologi Informasi (NCBI) memperkenalkan model baru untuk informasi urutan-terkait. Ini model baru dan lebih kuat memungkinkan pesatnya perkembangan perangkat lunak dan integrasi database yang mendasari sistem pengambilan Entrez populer dan di yang database GenBank sekarang dibangun (lih. Bab 7 untuk informasi lebih lanjut tentang Entrez). Keuntungan dari model (misalnya, kemampuan untuk bergerak dengan mudah dari diterbitkan literatur untuk urutan DNA dengan protein mereka mengkodekan, untuk kromosom peta gen, dan tiga-dimensi struktur protein) telah ahli biologi jelas selama bertahun-tahun ahli biologi menggunakan Entrez, tapi sangat sedikit memahami dasar di mana model ini dibangun. Sebagai informasi genom menjadi lebih kaya dan lebih kompleks, lebih dari model, data yang sebenarnya yang mendasari muncul dalam umum representasi seperti file GenBank. Tanpa masuk ke detail yang besar, bab ini mencoba untuk menyajikan sebuah panduan praktis untuk prinsip-prinsip model data NCBI dan kepentingannya ahli biologi di bangku. Beberapa Contoh Model Para flatfile GenBank adalah DNA-berpusat''''laporan, yang berarti bahwa suatu daerah DNA coding untuk protein diwakili oleh fitur''CDS,''atau wilayah''coding,''pada DNA. Sebuah kualifikasi (/ translation = "MLLYY") menggambarkan urutan amino asam yang diproduksi dengan menerjemahkan CDS. Satu set fitur yang terbatas tambahan dari DNA, seperti peptida tikar, kadang-kadang digunakan dalam flatfiles GenBank untuk menggambarkan pembelahan produk dari protein (mungkin tanpa nama) yang dijelaskan oleh / Terjemahan, tapi jelas ini bukan solusi yang memuaskan. Sebaliknya, sebagian besar protein database sekuens protein menyajikan tampilan berpusat''''di mana koneksi dengan gen pengkodean mungkin benar-benar hilang atau mungkin hanya secara tidak langsung dirujuk oleh nomor aksesi. Sering kali, koneksi ini tidak memberikan kodon yang tepat-untuk-asam amino korespondensi yang penting dalam melakukan mutasi analisis. Model Data NCBI berhubungan langsung dengan dua urutan yang terlibat: DNA urutan dan urutan protein. Proses penerjemahan direpresentasikan sebagai link antara dua sekuens daripada penjelasan pada satu sehubungan dengan lain. Protein-penjelasan terkait, seperti produk disosiasinya peptida, yang diwakili sebagai fitur dijelaskan langsung pada urutan protein. Dengan cara ini, menjadi sangat alami untuk menganalisis urutan protein yang berasal dari terjemahan fitur CDS oleh BLAST atau alat urutan pencari lainnya tanpa kehilangan hubungan yang tepat kembali untuk gen. Sebuah koleksi dari urutan DNA dan produk terjemahannya disebut Nuc-Prot ditetapkan, dan ini adalah bagaimana data tersebut diwakili oleh NCBI. Para GenBank flatfile format yang banyak pembaca yang sudah terbiasa hanyalah sebuah gaya tertentu laporan, salah satu yang''lebih''terbaca-manusia dan yang pada akhirnya merata terhubung koleksi urutan kembali ke akrab satu-urutan, DNA-berpusat tampilan. Navigasi yang disediakan oleh alat-alat seperti Entrez jauh lebih langsung mencerminkan mendasari struktur data tersebut. Urutan protein yang berasal dari WHO terjemahan yang dikembalikan oleh pencarian BLAST, pada kenyataannya, urutan proteindari Nuc-Prot set dijelaskan di atas. PENDAHULUAN 21 Format standar juga GenBank dapat menyembunyikan beberapa sifat-urutan beberapa urutan DNA. Sebagai contoh, tiga genom ekson gen tertentu yang diurutkan, dan sebagian daerah noncoding mengapit, sekitar ekson juga dapat yang tersedia, tetapi full-length urutan urutan ini intronic mungkin belum tersedia. Karena ekson tidak dalam konteks genomik lengkap mereka, akan ada menjadi tiga GenBank flatfiles dalam kasus ini, satu untuk masing-masing ekson. Tidak ada eksplisit representasi dari set lengkap urutan atas bahwa wilayah genomik; ketiga ekson datang dalam rangka genomik dan dipisahkan oleh panjang tertentu unsequenced DNA. Dalam format GenBank akan ada garis Segmen dari bentuk SEGMEN 1 dari 3 di record pertama, SEGMEN 2 dari 3 di kedua, dan SEGMEN 3 dari 3 di yang ketiga, tetapi ini hanya memberitahu pengguna bahwa garis-garis merupakan bagian dari beberapa terdefinisi, memerintahkan seri (Gambar 2.1A). Keluar dari rilis GenBank utuh, satu menempatkan Segmen yang benar catatan untuk menempatkan bersama-sama oleh algoritma melibatkan nama LOKUS.Semua segmen yang pergi bersama-sama menggunakan kombinasi pertama huruf yang sama, diakhiri dengan nomor sesuai dengan segmen, misalnya, HSDDT1, HSDDT2, dan HSDDT3. Jelas, ini pengaturan yang rumit dapat mengakibatkan masalah ketika nama LOKUS termasuk nomor yang secara tidak sengaja mengganggu seri seperti. Selain itu, tidak ada satu urutan catatan yang menggambarkan seri berkumpul utuh, dan tidak ada cara untuk menggambarkan jarak antara bagian-bagian individu. Tidak ada konvensi segmentasi di database EMBL urutan sama sekali, sehingga catatan yang berasal dari sumber itu atau didistribusikan dalam format yang kurang bahkan informasi yang tidak sempurna. Model NCBI Data mendefinisikan jenis urutan yang secara langsung mewakili seperti seri tersegmentasi, disebut urutan''''Alih tersegmentasi. daripada mengandung huruf A, G, C, dan T, urutan tersegmentasi berisi petunjuk tentang bagaimana hal itu dapat dibangun dari urutan lain. Mengingat kembali contoh di atas, urutan tersegmentasi akan berisi instruksi''mengambil semua HSDDT1, maka kesenjangan panjang tidak diketahui, maka semua HSDDT2, maka kesenjangan panjang tidak diketahui, maka semua HSDDT3''The. urutan tersegmentasi sendiri dapat memiliki nama (misalnya, HSDDT), nomor aksesi, fitur, kutipan, dan komentar, seperti GenBank catatan lainnya. Data jenis ini umumnya disimpan dalam satu set-Seg disebut''''berisi HSDDT urutan, HSDDT1, HSDDT2, HSDDT3 dan semua koneksi mereka dan fitur. Ketika GenBank rilis dibuat, seperti dalam kasus Nuc-Prot set, Seg-set yang rusak menjadi beberapa catatan, dan urutan tersegmentasi sendiri tidak terlihat. Namun, GenBank, EMBL, dan DDBJ baru-baru ini menyepakati cara untuk mewakili ini dibangun majelis, dan mereka akan ditempatkan di sebuah divisi CON baru, dengan CON berdiri untuk contig''''(Gambar 2.1b). Dalam tampilan grafis Entrez urutan tersegmentasi, urutan tersegmentasi ditampilkan sebagai garis yang menghubungkan semua komponen urutan (Gambar 2.1C). Sebuah urutan NCBI tersegmentasi tidak mengharuskan bahwa ada kesenjangan antara potongan individu. Bahkan potongan-potongan yang dapat tumpang tindih, tidak seperti kasus tersegmentasi seri dalam format GenBank. Hal ini membuat urutan tersegmentasi ideal untuk mewakili besar urutan genom seperti bakteri, yang mungkin banyak megabases panjang. Ini adalah apa yang saat ini dilakukan dalam divisi Genom Entrez untuk bakteri genom, serta kromosom lengkap lainnya seperti ragi. Para NCBI Perangkat Lunak Toolkit (Ostell, 1996) berisi fungsi yang dapat mengumpulkan data bahwa tersegmentasi urutan mengacu pada''on the fly,''termasuk urutan konstituen dan fitur, dan ini informasi secara otomatis dapat dipetakan dari koordinat kecil, individu merekam ke yang dari kromosom yang lengkap. Hal ini memungkinkan untuk memberikanTampilan grafis, flatfile GenBank pandangan, atau pandangan FASTA atau untuk melakukan analisis pada 22 THE NCBI DATA MODEL PENDAHULUAN 23 < Gambar 2.1. (A) bagian Terpilih dari GenBank-diformat catatan dalam urutan tersegmentasi. Format GenBank historis menunjukkan bahwa catatan hanya merupakan bagian dari beberapa seri memerintahkan; tidak menawarkan informasi tentang apa komponen-komponen lain atau bagaimana mereka terhubung. Untuk melihat tampilan lengkap dari catatan-catatan, lihat http://www.ncbi.nlm.nih.gov/htbin-post/Entrez/ uid = 6849043 permintaan? & bentuk = 6 & db = n & Dopt = g. (B) Representasi urutan tersegmentasi di divisi (contig) baru CON. Sebuah ekstensi baru dari format GenBank memungkinkan rincian konstruksi catatan tersegmentasi yang akan disajikan. Garis CONTIG dapat termasuk aksesi individu, kesenjangan panjang dikenal, dan kesenjangan panjang tidak diketahui. Para komponen individu masih dapat ditampilkan dalam bentuk tradisional, meskipun tidak ada fitur atau urutan yang hadir dalam format ini. (C) Grafis representasi dari urutan tersegmentasi.Pandangan ini menampilkan fitur dipetakan ke koordinat dari urutan tersegmentasi. Segmen mencakup semua wilayah exonic dan diterjemahkan ditambah 20 pasangan basa dari urutan di ujung masing-masing intron. Kesenjangan segmen mencakup urutan intronic tersisa. Seluruh kromosom cukup mudah, meskipun data hanya ada di kecil, individu potongan. Kemampuan untuk mudah merakit satu set urutan terkait pada permintaan untuk setiap daerah kromosom yang sangat besar telah terbukti berharga bagi bakteri genom. Majelis pada permintaan akan menjadi lebih dan lebih penting yang lebih besar dan daerah yang lebih besar diurutkan, mungkin oleh kelompok-kelompok yang berbeda, dan gagasan bahwa penyidik ​​akan bekerja pada satu record urutan besar menjadi benar-benar tidak praktis. Apa ASN.1 Harus Lakukan Dengan Ini? Para NCBI model data sering disebut sebagai, dan bingung dengan,''NCBI ASN.1'' atau''ASN.1 Model Data.''Sintaks Notasi Abstrak 1 (ASN.1) adalah Internasional Standar Organization (ISO) standar untuk mendeskripsikan data terstruktur yang dapat diandalkan mengkodekan data dengan cara yang memungkinkan komputer dan sistem perangkat lunak dari semua jenis untuk andal pertukaran baik struktur dan isi dari entri. Mengatakan bahwa data model ditulis dalam ASN.1 adalah seperti mengatakan sebuah program komputer yang ditulis dalam C atau FORTRAN. Pernyataan itu mengidentifikasi bahasa, ia tidak mengatakan apa program tidak. Para GenBank akrab flatfile benar-benar dirancang bagi manusia untuk membaca, dari DNA-berpusat sudut pandang. ASN.1 dirancang untuk sebuah komputer untuk membaca dan setuju untuk menggambarkan hubungan yang rumit data dalam cara yang sangat spesifik. NCBI menggambarkan dan proses data menggunakan format ASN.1. Berdasarkan bahwa format, tunggal umum,sejumlah format terbaca-manusia dan alat-alat yang diproduksi, seperti Entrez, GenBank, dan database BLAST. Tanpa adanya format umum seperti ini, para tetangga dan keras-link Entrez hubungan yang tergantung pada tidak akan mungkin. Bab ini berkaitan dengan struktur dan isi dari NCBI data model dan implikasinya untuk database biomedis dan alat. Detil diskusi tentang pilihan ASN.1 untuk tugas dan bentuk keseluruhan dapat ditemukan tempat lain (Ostell, 1995). Apa yang Menentukan? Kami telah menyinggung bagaimana model data yang mendefinisikan urutan NCBI dengan cara yang mendukung deskripsi yang lebih kaya dan lebih eksplisit dari data eksperimen dari yang dapat 24 THE NCBI DATA MODEL diperoleh dengan format GenBank. Rincian model adalah penting, dan akan diperluas di dalam diskusi berikutnya. Pada titik ini, kita perlu berhenti sejenak dan singkat menggambarkan penalaran dan prinsip-prinsip umum di balik model secara keseluruhan. Ada dua alasan utama untuk meletakkan data pada komputer: pengambilan dan penemuan. Retrieval pada dasarnya bisa mendapatkan kembali apa yang dimasukkan ke dalamnya mengumpulkan urutan informasi tanpa memberikan cara untuk mengambil itu membuat urutan informasi, pada dasarnya, tidak berguna. Meskipun ini penting, bahkan lebih berharga untuk bisa mendapatkan kembali dari pengetahuan sistem yang lebih daripada yang dimasukkan ke dalam untuk memulai dengan-yang, untuk dapat menggunakan informasi tersebut untuk membuat penemuan biologis. Para ilmuwan dapat membuat jenis penemuan oleh koneksi membedakan antara dua potongan informasi yang tidak diketahui kapan potongan dimasukkan secara terpisah ke dalam database atau dengan melakukan perhitungan pada data yang menawarkan baru wawasan ke dalam catatan. Dalam model data NCBI, penekanannya adalah pada memfasilitasi Penemuan, yang berarti data harus didefinisikan dengan cara yang setuju untuk kedua keterkaitan dan perhitungan. Sebuah pertimbangan, kedua umum untuk model adalah stabilitas. NCBI adalah Pemerintah AS lembaga, bukan kelompok didukung tahun ke tahun oleh hibah kompetitif. Jadi, NCBI staf mengambil pandangan yang sangat jangka panjang perannya dalam mendukung bioinformatika upaya. NCBI menyediakan sistem informasi besar-besaran yang akan dukungan ilmiah Permintaan baik ke masa depan. Sebagai orang yang terlibat dalam penelitian biomedis tahu, banyak revolusi konseptual dan teknis utama dapat terjadi ketika berhadapan dengan seperti rentang waktu yang lama. Entah bagaimana, NCBI harus mengatasi perubahan pandangan dan kebutuhan dengan perangkat lunak dan data yang mungkin telah dibuat tahun (atau dekade) sebelumnya. Untuk alasan itu, pengamatan dasar telah dipilih sebagai pusat data elemen, dengan interpretasi dan tata-nama (lebih elemen dapat berubah) ditempatkan di luar representasi, dasar inti dari data. Mengambil semua faktor, NCBI menggunakan data inti empat elemen: bibliografi kutipan, urutan DNA, urutan protein, dan tiga-dimensi struktur. Dalam Selain itu, dua proyek (taksonomi dan peta genom) lebih interpretatif tapi tetap sangat penting karena mengatur dan menghubungkan sumber daya yang NCBI telah membangun cukup dasar di daerah-daerah juga. PUBS: PUBLIKASI atau binasa Publikasi merupakan inti dari setiap usaha ilmiah. Ini adalah proses yang umum dimana informasi ilmiah ditinjau, dievaluasi, didistribusikan, dan dimasukkan ke dalam catatan permanen dari kemajuan ilmu pengetahuan. Publikasi berfungsi sebagai link penting antara faktual database dari struktur yang berbeda atau domain konten (misalnya, catatan secara berurutan database dan catatan dalam database genetik dapat mengutip artikel yang sama).Mereka berfungsi sebagai titik masuk yang berharga ke dalam database faktual (''Saya telah membaca sebuah artikel tentang ini, sekarang saya ingin melihat data primer''). Publikasi juga bertindak sebagai penjelasan penting dari fungsi dan konteks untuk catatandalam database faktual. Salah satu alasan untuk ini adalah bahwa database faktual memiliki struktur yang sangat penting untuk efisiensi penggunaan database tetapi mungkin tidak memiliki representasi kapasitas untuk mengatur maju konteks biologis, eksperimental, atau sejarah penuh catatan tertentu. Sebaliknya, makalah yang diterbitkan hanya dibatasi oleh bahasa dan berisi banyak informasi yang jelas lebih lengkap dan lebih rinci daripada sebelumnya akan di catatan dalam database faktual. Mungkin yang lebih penting, penulis dievaluasi oleh PUBS: PUBLIKASI atau binasa 25 mereka ilmiah rekan-rekan berdasarkan isi kertas mereka diterbitkan, bukan oleh isi dari catatan database yang terkait. Meskipun niat baik, para ilmuwan melanjutkan dan catatan database menjadi statis, meskipun pengetahuan tentang mereka telah diperluas, dan ada insentif sangat sedikit bagi para ilmuwan sibuk untuk belajar database sistem dan menyimpan catatan didasarkan pada studi laboratorium mereka sendiri up to date. Umumnya, bentuk dan isi dari kutipan belum memikirkan dengan hati-hati oleh mereka merancang database faktual, dan kualitas, bentuk, dan isi kutipan bisa sangat bervariasi dari satu database ke yang berikutnya. Kesadaran pentingnya memiliki link ke literatur yang diterbitkan dan kesadaran bahwa bibliografi kutipan jauh lebih stabil daripada pengetahuan ilmiah yang menyebabkan keputusan bahwa pekerjaan yang cermat dan lengkap mendefinisikan kutipan adalah upaya yang bermanfaat. Beberapa komponen dari spesifikasi publikasi dijelaskan di bawah ini mungkin khusus menarik bagi para ilmuwan atau pengguna dari database NCBI, tetapi diskusi penuh dari semua isu-isu yang mengarah ke keputusan yang mengatur spesifikasi sendiri akan membutuhkan bab lain dalam dirinya sendiri. Penulis Nama penulis diwakili dalam banyak format oleh berbagai database: nama terakhir saja, nama dan inisial terakhir, terakhir nama-koma-inisial, nama belakang dan nama depan, semua penulis dengan inisial dan yang terakhir dengan nama pertama penuh, dengan atau tanpa Gelar kehormatan (Ph.D.) atau akhiran (Jr, III), untuk nama hanya beberapa. Beberapa bibliografi database (seperti MEDLINE) mungkin hanya mewakili sejumlah penulis tetap. Meskipun inkonsistensi ini hanya buruk untuk pembaca manusia, itu menimbulkan masalah berat untuk sistem database menggabungkan nama dari berbagai sumber dan fungsi memberikan yang sederhana seperti mencari kutipan oleh nama penulis terakhir, seperti Entrez tidak. Untuk alasan ini, spesifikasi menyediakan dua bentuk representasi alternatif nama penulis: satu sederhana string dan membentuk lainnya terstruktur dengan kolom untuk nama belakang, nama pertama, dan seterusnya pada. Bila data yang disampaikan langsung kepada NCBI atau dalam kasus ketika ada yang konsisten format nama penulis dari sumber tertentu (seperti MEDLINE), yang terstruktur formulir yang digunakan. Bila formulir tidak dapat diuraikan, nama penulis tetap sebagai string. Hal ini membatasi penggunaannya untuk pengambilan tapi setidaknya memungkinkan data yang akan dilihat ketika catatan diambil dengan cara lain. Bahkan bentuk terstruktur nama penulis harus mendukung keragaman, karena beberapa sumber memberikan inisial sedangkan yang lain hanya memberikan nama pertama dan menengah. Hal ini disebutkan secara khusus menekankan dua poin. Pertama, model data NCBI dirancang baik untuk mengarahkan pandangan kita data menjadi bentuk yang lebih berguna dan untuk mengakomodasi data yang ada tersedia. (Ini sepasang fungsi dapat membingungkan untuk orang membaca spesifikasi dan melihat bentuk-bentuk alternatif dari data yang sama yang didefinisikan.) Kedua, pengembang perangkat lunak harus menyadari hal ini berbagai pernyataan dan mengakomodasi bentuk apapun harus digunakan ketika sumber tertentu sedang dikonversi. Secara umum, NCBI mencoba untuk mendapatkan sebanyak mungkin data ke dalam seragam, terstruktur bentuk mungkin tapi membawa beristirahat dalam cara yang kurang optimal daripada kehilangan sama sekali. Penulis afiliasi (yaitu, alamat institusi penulis ') bahkan lebih rumit. Seperti dengan nama penulis, ada masalah mendukung kedua bentuk terstruktur dan unparsed string. Namun, bahkan sumber dengan nama penulis cukup konsisten konvensi seringkali menghasilkan informasi afiliasi yang tidak dapat diurai dari teks ke dalam format yang terstruktur. Selain itu, mungkin ada afiliasi yang terkait dengan seluruh 26 THE NCBI DATA MODEL daftar penulis, atau mungkin ada afiliasi yang berbeda terkait dengan penulis. Para NCBI model data memungkinkan untuk kedua skenario. Pada saat penulisan ini hanya yang pertama Bentuk didukung baik dalam MEDLINE atau GenBank, kedua jenis dapat muncul dalam diterbitkan artikel. 
Model NCBI data adalah pemetaan alami tentang bagaimana ahli biologi berpikir tentang urutan hubungan dan bagaimana mereka menjelaskannya urutan ini. Data yang hasilnya dapat disimpan, diteruskan ke program analisis lain, dimodifikasi, dan kemudian ditampilkan, semua tanpa harus melalui beberapa konversi format. Definisi model konsentrat pada elemen data dasar yang dapat diukur di laboratorium, seperti urutan molekul terisolasi. Sebagai konsep biologis baru didefinisikan dan dipahami, spesifikasi untuk data dapat dengan mudah diperluas tanpa perlu mengubah data yang ada. Perangkat lunak yang stabil dari waktu ke waktu, dan hanya perubahan incremental dibutuhkan untuk sebuah program untuk mengambil keuntungan dari bidang data baru.Memisahkan spesifikasi ke dalam domain (misalnya, kutipan, urutan, struktur, peta) mengurangi kompleksitas dari model data. Menyediakan tetangga dan link antara catatan individu meningkatkan kekayaan data dan meningkatkan kemungkinan membuat penemuan dari database.