বায়োইনফর্মেটিক্সে হাতে খড়ি

বায়োইনফরমেটিক্স হলো জৈবপ্রযুক্তি এবং তথ্যপ্রযুক্তির মিলনে উৎপন্ন এক নতুন শাখা যেখানে জীব বিজ্ঞানের বিভিন্ন তথ্য কম্পিউটারের সাহায্যে বিশ্লেষণ করা হয়। এটি মুলত জীব বিজ্ঞান, কম্পিউটার সায়েন্স, গণিত ও পরিসংখ্যানের একটি মিলিত ক্ষেত্র। সংক্ষেপে বলতে গেলে কম্পিউটারের চোখে দেখা জীব বিজ্ঞানই বায়োইনফর্মেটিক্স। এখানে বিভিন্ন জৈবপদার্থের মধ্যে মিল-অমিল, তাদের ত্রিমাত্রিক গঠন, পরস্পরের মধ্যে সম্পর্ক এবং বিবর্তনিক ইতিহাস ইত্যাদি নিয়ে গবেষণা করা হয়। বিজ্ঞানের নতুন শাখা হলেও এর মাধ্যমে এমন অনেক কিছুই এখন মুহুর্তের মধ্যে করা সম্ভব যাকিনা আগে করতে সময় লাগতো বহু বছর। এখানেই বোধহয় বোকা কম্পিউটারের রহস্যময় চালাকি। বায়োইনফর্মেটিক্স শিখছি তাই ভাবলাম একটু গ্যাঁজাই – কথায় আছেনা ভাঙা কলসি বাজে বেশি! 😛

বায়োইনফর্মেটিক্স মানেই গবেষণা তবে এক্ষেত্রে গবেষণার প্রকৃতি একটু ভিন্ন। জীব বিজ্ঞান, রসায়নে রিসার্চ বা গবেষণা বলতে আমাদের ব্রেনে যে ছবিগুলো আসে – বিকার, টেস্টটিউব, বিক্রিয়ক, প্রাণী ব্যাবচ্ছেদ করা ইত্যাদি। আজকাল কম্পিউটারের উন্নতির সাথে সাথে গবেষনার ধরন পাল্টেছে। এখন গবেষণা দুই প্রকার – ওয়েট ল্যাব (Wet Lab) গবেষণা এবং ড্রাই ল্যাব (Dry Lab) গবেষণা। ওয়েট ল্যাব গবেষণা বলতে ল্যাবে প্রানী ব্যাবচ্ছেদ বা বিভিন্ন রাসায়নিক বিক্রিয়া সম্পর্কিত কাজ বুঝায় এবং ওয়েট ল্যাব থেকে প্রাপ্ত তথ্য নিয়ে কম্পিউটারে বিশ্লেষণ করে কোন যৌক্তিক ফলাফল দাড় করানোই ড্রাই ল্যাব গবেষণা বলে। গবেষণার ক্ষেত্রে বায়োইনফর্মেটিক্স ড্রাই ল্যাবের অন্তর্ভুক্ত। ড্রাই ল্যাব গবেষনার অপর নাম ইন সিলিকো (In Silico) গবেষণা। এখন প্রশ্ন হতে পারে যে ড্রাই ল্যাবের কাজের জন্য ওয়েট ল্যাব কি আবশ্যক!? এর উত্তর একই সাথে হ্যা এবং না। হ্যা কারন ওয়েট ল্যাব ছাড়া ড্রাই ল্যাবের তথ্য আসবে কোথা থেকে; আবার না কারন ড্রাই ল্যাবে কাজ করার জন্য যে ডাটা প্রয়োজন সেই কাজ অনেকেই করে রেখেছে ইতোমধ্যে। এর কারন একই সাথে দুই ধরনের ল্যাবে দক্ষ হওয়া বেশ কঠিন এবং শ্রমসাধ্য। এজন্য ওয়েট ল্যাব থেকে প্রাপ্ত তথ্য গুলো বিভিন্ন বায়োলজিক্যাল ডাটাবেজে (বিস্তারিত জানতে পরবর্তি লেখা পড়ুন) জমা করা হয় যাতে প্রয়োজনে সেখান থেকে তথ্য উপাত্ত নিয়ে ড্রাই ল্যাবে কাজ করা যায়।

জীব বিজ্ঞানের কম্পিউটার মেডিয়েটেড গবেষণাই মুলত বায়োইনফর্মেটিক্সে। এখানে কম্পিউটারের সাহায্যে সিকুয়েন্স অ্যালাইনমেন্ট, জিন বা প্রোটিনের গঠন ও ফাংশন, জিন অনুসন্ধান, জিনোম সমন্বয়, প্রোটিন ডিজাইন, প্রোটিন-প্রোটিন মিথস্ক্রিয়া, প্রানী জগতের মধ্যকার সম্পর্ক ও বিবর্তন ইত্যাদি নিয়ে গবেষনা করা হয়। বায়োইনফর্মেটিক্সে সবথেকে বেশি ব্যাবহারিত পদ্ধতি হলো সিকুয়েন্স এলাইন্মেন্ট। সিকুয়েন্স এলাইন্মেন্ট বলতে দুই বা ততোধিক নিউক্লিক এসিড (DNA বা RNA) বা প্রোটিনের মধ্যকার সাদৃশ্যতা পরিক্ষা করাকে বুঝায়। সিকুয়েন্স এলাইন্মেন্টে কাঙ্ক্ষিত ডিএনএ বা প্রোটিনগুলো পাশাপাশি রেখে মিলিয়ে দেখা হয় কোনটার সাথে কতটা মিল। একটা জৈবপদার্থের সাথে অন্যটির যত মিল তারা তত কাছাকাছি অথবা নিকটতম উৎসের। যেমন আমাদের সবথেকে কাছের আত্মীয় হল শিম্পাঞ্জি তাই মানুষের ডিএনএর সাথে সবথেকে বেশি মিল পাওয়া যাবে শিম্পাঞ্জীর সাথে। সিকুয়েন্স এলাইন্মেন্টের জন্য বিভিন্ন ডাটাবেজের সাথে ব্লাস্ট (BLAST) বা ব্লাট (BLAT) নামক একটা ওয়েব এপ্লিকেশন আছে। এর মাধ্যমে খুব সহজেই কাঙ্ক্ষিত সিকুয়েন্সের এলাইন্মেন্ট করা যায়। মাল্টিপল সিকুয়েন্স এলাইন্মেন্টের জন্য আছে জালভিউ (JalView) নামক সফটওয়্যার।

প্রোটিন হল জীব দেহের কার্যকর পদার্থ। প্রাণীদেহ গঠনের মুল উপাদান প্রোটিন, অসংখ্যা রকমের প্রোটিন থাকে প্রানীদেহে, কোনটা মাংশপেশি, কোনটা হাড় আবার কোনটা হরমোন হিসাবে কাজ করে। ডিএনএ বা আরএনএর মতো প্রোটিনও মুলত ২০ রকম অ্যামাইনো এসিডের বিভিন্ন ক্রমে তৈরি লম্বা সুতা কিন্তু সুতা আকৃতির প্রোটিন কার্যকারী নয়, কাজ করতে গেলে প্রোটিনকে বিভিন্নভাবে জড়িয়ে পেচিয়ে ত্রিমাত্রিক গঠন তৈরি করতে হয়, প্রোটিনের এই ত্রিমাত্রিক গড়নে বিভিন্ন খোপ খোপ থাকে। বায়োইনফর্মেটিক্সের সাহায্যে এই প্রোটিনের ত্রিমাত্রিক গঠন বিশ্লেষণ করে বের করা সম্ভব কেন এবং কিভাবে প্রোটিন আমাদের দেহে কাজ করে, এবং প্রয়োজনে আরো বেশি কার্যকর প্রোটিনের নকশা তৈরি করা যায়। প্রোটিন বিশ্লেষণ ড্রাগ ডিজাইন করতেও সাহায্য করে কারন ওষুধগুলো মুলত প্রোটিনের পেচানো ত্রিমাত্রিক গঠনের বিভিন্ন খোপের ঢুকে প্রোটিনের গঠন পরিবর্তন করে অসুখের বিরুদ্ধে কাজ করে তাই প্রোটিনের গঠন বিশ্লেষণ করে খুব সহজেই অধিক কার্যকারী ড্রাগ ডিজাইন করা যায়। এছাড়া আগে যেখানে পরিক্ষামুলক ভাবে ড্রাগগুলো মানুষের উপর চালানো হতো (যা অধিক ঝুকিপুর্ন) কিন্তু এখন সেটা কম্পিউটারেই করা সম্ভব। কম্পিউটারেই হিসাব করে সবথেকে কার্যকারী ও নিরাপদ অষুধ তৈরি করা যায়। প্রোটিনের গঠন বিশ্লেষণ করার জন্য জনপ্রিয় সফটওয়্যার হলো কাইমেরা (Chimera)।

ডারউইন বিবর্তনবাদের জন্ম না দিলেও, আজকের আনবিক জীব বিজ্ঞান থেকে বিবর্তনবাদ এমনিতেই বের হয়ে আসতো। বিবর্তনবাদ অনুযায়ী পৃথিবীর সকল প্রানীর আবির্ভাব একটা সাধারন পুর্বপুরুষ থেকে। আগে এটা ফসিলের মধ্যকার মিল-অমিল থেকে বের করা হতো কিন্তু আনবিক বিবর্তন এটা বলে যে প্রত্যেক প্রানীর আবির্ভাব একটা সাধারন পুর্বপুরুষ থেকে হলে প্রত্যেক প্রানীর ডিএনএতে তার ছাপ থাকা আবশ্যক। জিন বিজ্ঞানের উন্নতির সাথে সাথে সেটা বেশ দাপটের সাথেই প্রামানিত হয়েছে এবং বিবর্তনবাদকে নিয়ে গেছে নির্ভরযোগ্যতার অনন্য উচ্চতায়। একটা প্রাণীর ডিএনএ থেকে অন্য প্রানীর ডিএনএর যতটা অমিল প্রাণী দুইটার মধ্যকার সম্পর্কের দূরত্ব ঠিক ততটাই। এই থিওরি ব্যাবহার করে বায়োইনফর্মেটিক্সের মাধ্যমে কোন জীবের ডিএনএ থেকে তার সম্পর্কে সবকিছু জেনে ফেলা সম্ভব, এমনকি উক্ত প্রানীটি কোন গোত্রের বা পরিবারের অথবা তার নিকটতম প্রানী কোন গুলো, উক্ত প্রানীর আবির্ভাব কোন যুগে ইত্যাদি। এভাবেই নির্মান করে ফেলা সম্ভব উক্ত প্রানীর ফাইলোজেনেটিক ট্রি।

জৈবডাটাবেজ পরিচিতি


ডাটাবেজ হলো তথ্য ব্যাবস্থাপনার এমন একটা সিস্টেম যেখানে বিভিন্ন তথ্য সংরক্ষন করা হয় যাতে পরবর্তিতে এসব তথ্য নিয়ে কাজ করা যায় এবং প্রয়োজনে নতুন তথ্য সংযোজন বা বিয়োজন করা যায়। জৈবতথ্যের ডাটাবেজ বলতে এখানে বিভিন্ন প্রকার জৈবতথ্য, যেমন, নিউক্লিক এসিড (DNA বা RNA), প্রোটিন, অ্যামাইনো এসিড ইত্যাদি সম্পর্কিত বিভিন্ন তথ্য সংরক্ষন করা হয় এবং সেগুলো নিয়ে কাজ করার সুযোগ রাখা হয়। এরকম ডাটাবেজ তৈরির উদ্দেশ্যই হলো সবাই যাতে সল্প সময়ে অল্প শ্রমে সকল তথ্য একজায়গায় খুজে পায় এবং সেগুলো নিয়ে কাজ করে নতুন তথ্য সংরক্ষন করতে পারে।

ডাটাবেজের কিছু বৈশিষ্ট

ডাটাবেজের ধরন অনুযায়ী বিশেষ কিছু সুবিধা ছাড়া সকল ডাটাবেজের কিছু সাধারন বৈশিষ্ট মেনে চলে যাতে করে একজন ব্যাবহারকারী খুব সহজেই তথ্য খুজে বের করতে পারে। এরকম কিছু ব্যাপার উল্লেখ করছিঃ

  • প্রায় সকল ডাটাবেজের ওয়েব ইন্টারফেসে সার্স বা তথ্য খোজার ব্যাবস্থা থাকে। ব্যাবহারকারী উক্ত সার্স বক্সে কাঙ্ক্ষিত শব্দ লিখে সার্স করলেই ওই সম্পর্কিত সকল তথ্য সামনে হাজির করে।
  • ব্যাবহারকারি ইচ্ছে করলেই বিভিন্ন রকমভাবে তথ্য খুজতে পারেন এবং প্রয়োজনে কাঙ্ক্ষিত তথ্য তার কম্পিউটারে সেইভ করে রাখতে পারেন।
  • প্রত্যেক তথ্যের সাথে ক্রস-রেফারেন্স থাকে যাতে খুব সহজেই এক ডাটাবেজ থেকে অন্য ডাটাবেজে জাম্প করা যায়।
  • ডাটাবেজ গুলো পরস্পরের সাথে যুক্ত এবং ২৪ ঘন্টাই প্রতিটা ডাটাবেজে ডাটা আপডেট হতে থাকে। তাই নির্দিষ্ট কোন ডাটাবেজ নির্বাচনের প্রয়োজন নাই।

জৈবতথ্য ডাটাবেজের প্রকারভেদ

বিভিন্ন রকম তথ্য রাখার জন্য বিভিন্ন ডাটাবেজ আছে। তথ্যের রকমফেরে ডাটাবেজ মুলত চার প্রকারঃ জিনোম ডাটাবেজ-এখানে কোন জীবের সমস্ত জিন সম্পর্কিত তথ্য সংরক্ষন করা হয়; নিউক্লিওটাইড ডাটাবেজ-এখানে জীবের ডিএনএ বা আরএনএ সংরক্ষন করা হয়; প্রোটিন ডাটাবেজ-এখানে প্রোটিন সম্পর্কিত তথ্য জমা থাকে; অ্যামিনো এসিড ডাটাবেজ-এখানে সকল অ্যামিনো এসিড সিকুয়েন্স বা গঠন রেকর্ড করা থাকে। এছাড়াও ডাটা সংগ্রহস্থলের ভিত্তিতে অনুযায়ী ডাটাবেজ আবার প্রধানত দুই প্রকারঃ (১) পাবলিক ডাটাবেজএই ধরনের ডাটাবেজ মুলত সবার জন্য উন্মুক্ত ও বৈধ (অল্প কিছুক্ষেত্রে ব্যাতিক্রম আছে বৈকি) এবং এখানে সবধরনের তথ্য জমা করা হয়; (২) প্রাইভেট ডাটাবেজ-এগুলো সবার জন্য উন্মুক্ত নয়, এখানে মুলত প্যাটেন্ট অন্তর্ভুক্ত তথ্য সংরক্ষন করা হয় এবং প্রবেশাধিকার পেতে নির্দিষ্ট পরিমাণ অর্থ ব্যয় করতে হয়।

ডাটাবেজের প্রকার

ধারণকৃত তথ্য

Bibliographic Databases

Literature

Taxonomic Databases

Classification

Nucleic Acid Databases

DNA Information

Protein Databases

Protein Information

Genomic Databases

Gene Level Information

Enzyme or Metabolic Pathways

Metabolic Pathways Information

প্রকৃতপক্ষে ডাটাবেজকে তথ্যের প্রকৃতি ও বিস্তৃতির উপর ভিত্তি করে প্রধান তিনটি ভাগে ভাগ করা যায়ঃ প্রাইমারি, সেকেন্ডারি এবং কম্পোজিট ডাটাবেজ। নিউক্লিক এসিড বা প্রোটিনের ক্ষেত্রে আলাদাভাবে প্রাইমারী এবং সেকেন্ডারি ডাটাবেজ বিদ্যমান, নিচে এটা সম্পর্কে বিস্তারিত দেওয়া হলো।

প্রাইমারি ডাটাবেজঃ এধরনের ডাটাবেজে মুলত নিউক্লিক এসিড বা প্রোটিনের সিকুয়েন্স সম্পর্কিত তথ্য থাকে। প্রধান তিনটি প্রাইমারী নিক্লিওটাইড ডাটাবেজ হলো – GenBank (Genetic Sequence Databank) DDBJ (DNA Data Bank of Japan) এবং EMBL (European Molecular Biology Laboratory)। এই তিনটি মিলে আবার International Nucleotide Sequence Database Collaboration (INSDC) গঠন করেছে। প্রধান তিনটি প্রাইমারি প্রোটিন ডাটাবেজ হলো – SWISS-PROT, TrEMBL এবং PIR (Protein Information Resource)।

সেকন্ডারি ডাটাবেজঃ প্রাইমারি ডাটাবেজ থেকে তথ্য নিয়ে বিশ্লেষন করে প্রাপ্ত তথ্যের সংকলনই সেকেন্ডারি ডাটাবেজ। এখানে জীন বা প্রোটিনের সিকুয়েন্স ছাড়াও গঠন ও ফাংশন সম্পর্কিত বিভিন্ন তথ্য সংযুক্ত থাকে। সেকেন্ডারি নিউক্লিওটাইড ডাটাবেজ হলো UniGene (Unique Gene Cluster), HSD (HIV Sequence Database) এবং REBASE। প্রধান কিছু সেকেন্ডারি প্রোটিন ডাটাবেজ হলো, TrEMBL, SP-TrEMBL, REM-TrEMBL, SPRT (SWALL), PDB (Protein Data Bank), Prosite এবং Pfam। এখানে মুলত সকল সিকুয়েন্সের ডাটা থাকেনা বরং যেগুলো নিয়ে কাজ হয়েছে সেগুলোই থাকে।

কম্পোজিট ডাটাবেজঃ কম্পোজিট ডাটাবেজ হলো বিভিন্ন প্রাইমারী ডাটাবেজের সমন্বয়। কম্পোজিট ডাটাবেজ তৈরির লক্ষ্যই হলো বিভিন্ন ডাটাবেজকে মিলিত করে সবথেকে সম্পুর্ন এবং কার্যকারী তথ্যগুলো একত্রিত করা। প্রধান দুটি কম্পোজিট ডাটাবেজ হলো যথাক্রমে – NRDB (Non-Redundant Data Base)  এবং OWL। কম্পোজিট ডাটাবেজ OWL হলো মুলত প্রধান চারটি প্রাইমারী ডাটাবেজের সমন্বয় সেগুলো যথাক্রমে SWISS-PROT, PIR, GenBank এবং NRL-3D

জৈবডাটাবেজের সংক্ষিপ্ত তালিকা!

আমি খুব ভুলোমনা  তাই টুকিটাকি বিষয়গুলো টুকে রাখতে হয়। আগের একটা লেখায় জৈবতথ্য ভিত্তিক ডাটাবেজ নিয়ে অনেক ক্যাচাল করেছি। এই লেখাটা তারই একটা ছোট সংস্করণ। এখানে বিভিন্ন জৈবতথ্যের মুল ডাটাবেজ গুলো একটু পয়েন্ট করে রাখছি – যাতে কাজের সময় চট করে দেখে নিতে পারি। আমার মত গোল্ডফিস স্মৃতিধারী লোকের জন্য এর থেকে ভালো উপায় কি! আশা করি অন্যদেরও কাজে আসবে। বড্ড বেশি বকছি বোধহয়, এবার এগোনো যাক!

জিনোম ডাটাবেজঃ বেশিরভাগ অর্গানিজমের জন্য পৃথক পৃথক ডাটাবেজ আছে। সবগুলোতো মনে রাখা সম্ভব নয়, এজন্য কাজ চলার মত দুয়েকটা মনে রাখলেই আপাতত হবে। সবকিছুই মোটামুটি পাওয়া যায় এমন দুটি ডাটাবেজ পোর্টাল হলো – ENSEMBL এবং ENSEMBL GENOMES। ENSEMBL মানুষ, ইদুর ও অন্যান্য মেরুদণ্ডী প্রানির জিনোম জমা রাখে; এবং ENSEMBL GENOMES উদ্ভিদ ও অণুজীবদের জিনোম সংরক্ষন করে। এছাড়াও রোগের উপর ভিত্তি করে অনুজীব জিনোমের জন্য CAMERA ডাটাবেজ রয়েছে।

নিউক্লিওটাইড ডাটাবেজঃ নিউক্লিক এসিড তথা DNA বা RNA এর জন্য প্রধানত তিনটি ডাটাবেজ রয়েছে, যথাক্রমে – GenBank (Gene Bank, NCBI), EMBL (European Molecular Biotechnology Laboratory, EBI) এবং DDBJ (DNA Data Bank of Japan, NIG) ব্যাপক জনপ্রিয়। সকল জীবের নিউক্লিওটাইড এখানে পাওয়া যাবে।

প্রোটিন সিকুয়েন্স ডাটাবেজঃ প্রোটিনে অ্যামাইনো এসিডের সিকুয়েন্স জানার জন্য বহুল আলোচিত পোর্টালসমুহ হলো PIR (Protein Information Resource, GUMC), Swiss-Prot (Swiss Institute of Bioinformatics), PROSITE (Database of Protein Families and Domains) এবং Pfam (Protein families, Sanger Institute) জনপ্রিয়। এসব ডাটাবেজ একত্রিত করে আবার নতুন ডাটাবেজ তৈরি করা হইছে, যেমন UniProt ডাটাবেজ – এটি EBI, Swiss-Prot এবং PIR এর সমন্বয়ে গঠিত।

প্রোটিওমিক্স ডাটাবেজঃ প্রোটিওমিক্স সম্পর্কিত তথ্যের জন্য PRIDE (Proteomics Identifications Database, EBI) সবথেকে জনপ্রিয়। PRIDE হলো সকল প্রকার প্রোটিন, পেপটাইড এবং তাদের মডিফিকেশন সম্পর্কিত সকল তথ্যের পাবলিক ভান্ডার।

প্রোটিন গঠনভিত্তিক ডাটাবেজঃ প্রোটিনের গঠন সম্পর্কে জানার ক্ষেত্রে PDB (Protein Data Bank) এবং RCSB (Research Collaboratory for Structural Bioinformatics) সবথেকে আলোচিত। PDB এর আবার দুটি শাখা একটা ইউরোপ অন্যটি জাপান, এদের যথাক্রমে PDBe এবং PDBj দিয়ে চিহ্নিত করা হয়।

প্রোটিন মডেল ডাটাবেজঃ কোন প্রোটিনের গাঠনিক নকশা তৈরি করার জন্য Swiss-Model এবং ModBase বেশ জনপ্রিয়। Swiss-Model বিভিন্ন প্রকার প্রোটিনের নকশা সংগ্রহ করে, এবং ModBase বিভিন্ন প্রকার প্রোটিনের নকশার তুলনামুলক তথ্য সংগ্রহ করে।

আরএনএ ডাটাবেজঃ  বিভিন্ন প্রকার RNA এর জন্য আলাদা আলাদা ডাটাবেজ আছে তথাপি সামান্য কাজের ক্ষেত্রে Rfam (RNA families) এবং miRBase (MicroRNA Database) দিয়েই চলে যাবে। Rfam বিভিন্ন প্রকার RNA পরিবারের তথ্য সংরক্ষন করে, অপরদিকে MicroRNA শুধুমাত্র Micro RNA সম্পর্কিত তথ্য জমা রাখে।

মাইক্রোএরে ডাটাবেজঃ মাইক্রোএরে এনালাইসিসের জন্য ArrayExpress বহুল ব্যাবহারিত। এটা মুলত European Bioinformatics Institute (EBI) এর তৈরি ডাটাবেজ। এছাড়াও আছে National Center for Biotechnology Information (NCBI) কতৃক তৈরি Gene Expression Omnibus

এছাড়াও বিভিন্ন প্রকার বায়োলজিকাল তথ্যভান্ডার বিদ্যমান কিন্তু এগুলোই নতুনদের জন্য যথেষ্ট। উপরের ডাটাবেজ গুলো দিয়েই মোটামুটি কাজ চালানো সম্ভব। মোটকথা, ডাটাবেজ হচ্ছে একপ্রকার সংগ্রহশালা, জৈবতথ্য ডাটাবেজ মানে হলো জৈবতথ্যের সংগ্রহশালা। এখান থেকে চাইলে যেকেউ যেকোন তথ্য খুব সহজে পেতে পারে। গবেষনার সুবিধার্থে ডাটাবেজ গুলোকে প্রাইমারি, সেকেন্ডারি এবং কম্পোজিট ডাটাবেজে ভাগ করা হয়েছে। এখন কেউ প্রোটিন নিয়ে কাজ করতে চাইলে, প্রথমে প্রাইমারি ডাটাবেজ থেকে পছন্দমত প্রোটিন নির্বাচন করুন অতঃপর সেকেন্ডারি ডাটাবেজে গিয়ে দেখে নিন উক্ত প্রোটিন নিয়ে কোন কাজ হয়েছে কিনা! কেউ কাজ না করে থাকলে বুঝতেই পারছেন দিনটা আপনার।

বায়োইনফর্মেটিক্সে টুলস ও সফটওয়্যার


বায়োইনফরমেটিক্স এখন অনেক বিস্তৃত এক শাখা। একে প্রানবন্ত করার জন্য প্রতি মুহুর্তে বায়োইনফর্মেটিক্স নিয়ে প্রোগ্রামাররা ভাবছে আর নতুন নতুন ভাষা এবং এলগোরিদম বের করছে কাজকে সহজ সংক্ষেপ করার লক্ষ্যে। বিভিন্ন রকম কাজে বিভিন্ন টুলস বা সফটওয়্যার ব্যাবহার করা হয়। কাজের ধরন অনুযায়ী এসব টুলস আলাদা আলাদা। বেশিরভাগ টুলস ওয়েব কেন্দ্রিক যেগুলো বিভিন্ন ডাটাবেজের সাথে সংশ্লিষ্ট; তবে কাজের নিয়ন্ত্রনের অনুযায়ী ডেস্কটপ কেন্দ্রিক সফটওয়্যারও আছে। নিচে কিছু বেসিক টুলস নোট করে রাখলাম।

ব্লাস্ট টুলসঃ ডিএনএ, আরএনএ বা প্রোটিন সিকুয়েন্সের মধ্যে সাদৃশ্য-বৈশাদৃশ্য বের করার জন্য সিকুয়েন্স এলাইন্মেন্ট করা হয়। এটাই বায়োইনফর্মেটিক্সে সবথেকে বহুল ব্যাবহারিত পদ্ধতি, এজন্য কাঙ্ক্ষিত ডিএনএ বা প্রোটিন খন্ডকে ব্লাস্ট করা হয়। ব্লাস্ট (BLAST) এতটাই গুরুত্বপুর্ন যে প্রায় প্রতিটা ডাটাবেজের সাথে এটা ওয়েব এপ্লিকেশন হিসাবে দেওয়া থাকে।

ফাইলোজেনি টুলসঃ জৈবতথ্যের (প্রোটিন বা নিউক্লিক এসিড) তুলনামুলক বিশ্লেষণ করে ফাইলোজেনি ট্রি তৈরি করা সম্ভব যা থেকে কোন জীবের বিবর্তনের ইতিহাস জানা যায়। ফাইলোজেনি ট্রি তৈরির জন্য ডাটাবেজে একটা ওয়েব এপ্লিকেশন থাকে, এছাড়াও জনপ্রিয় বেশ কয়েকটি সফটওয়্যার বা টুলস আছে যেমনঃ ক্রাস্টালডাব্লিউ (CrustalW), টি-রেক্স (T-Rex), ফাইলিপ (PHYLIP), মেগা (MEGA)।

মাল্টিপল সিকুয়েন্স এলাইন্মেন্ট: দুই বা ততোধিক প্রোটিন বা নিউক্লিক এসিড অনুক্রমের মধ্যে সাদৃশ্য-বৈশাদৃশ্য খুজে বের করার জন্য মাল্টিপল সিকুয়েন্স এলাইন্মেন্ট করা হয়, এটা ওয়েব বেজ এপ্লিকেশন ছাড়াও নির্দিষ্ট টুলস দিয়ে করা যায়, এক্ষেত্রে জালভিউ (JalView) এবং ক্রাস্টালওমেগা (Crustal Omega) বেশ জনপ্রিয়।

প্রোটিন বিশ্লেষনঃ প্রোটিনের গঠন সম্পর্কিত কাজের জন্য ওয়েব-ভিত্তিক সবথেকে জনপ্রিয় এপ্লিকেশন হলো সুইস-মডেল (Swiss-Model), মডেলার (Modellar); এবং সফটওয়্যার হলো কাইমেরা (Chimera)।

প্রাইমার ডিজাইনঃ নির্দিষ্ট জিন খুজতে এবং গবেষণা করতে প্রাইমার ডিজাইন করার প্রয়োজন হয়। এক্ষেত্রে ওয়েব-ভিত্তিক বিভিন্ন জনপ্রিয় টুলস আছে যেমন NCBI এর প্রাইমার ব্লাস্ট টুলস (Primer BLAST) এবং ফ্রি অনলাইন টুল প্রাইমারথ্রি (Primer3) খুব কাজের।

সত্যি বলতে ল্যাব, সময় এবং কাজের ধরন অনুযায়ী গবেষকরা এলগরিদম মোটামুটি ঠিক রেখে বিভিন্ন ভাবে এইসব টুলস তৈরি করেছেন তাই অত্যবশ্যকীয়ভাবে এর বাইরেও বহু টুলস আছে এবং নিত্য নতুন তৈরি  হচ্ছেই। এখানে শুধুমাত্র বহুল ব্যবহারিত টুলস গুলোই দেওয়া হয়েছে।

বায়োইনফরমেটিক্সের প্রয়োগ ও ভবিষ্যৎ


যদিও বায়োইনফর্মেটিক্সের ইতিহাস খুব বেশি দিনের নয় কিন্তু এর সম্ভাবনা এবং ভবিষ্যৎ সম্পর্কে বেশ ভালই অনুমান করা যাচ্ছে। জেনেটিক ইঞ্জিনিয়ারিং ও তথ্য প্রযুক্তির উন্নতির ফলে বায়োইনফর্মেটিক্স খুব দ্রুত গতিতে এগিয়ে চলছে। আগে যেকাজ করতে মাসের পর মাস লাগতো যা কিনা আবার ওয়েট ল্যাবে সেটা এখন ঘরে বসে ঘন্টাখানেক সময়েই করা সম্ভব। এতে একদিকে যেমন সময় ও অর্থ ব্যয় হচ্ছে কম, অন্যদিকে গবেষনা করাও সহজ হচ্ছে। নিচে বায়োইনফর্মেটিক্সের কিছু প্রয়োগ এবং এর ভবিষ্যৎ নিয়ে দুচারটা কথা লিখলাম।

জিনোমিক্স (Genomics): কোন জীবের জিনোমকে কম্পিউটারের সাহায্যে বিশ্লেষন করার পদ্ধতিই জিনোমিক্স। প্রকৃতপক্ষে একটি জীবের জিনোমের বেশিরভাগ জীন অপ্রয়োজনীয়। এই বিপুল পরিমান জীন নিয়ে কাজ করা প্রায় অসম্ভব। এক্ষেত্রে বায়োইনফরমেটিক্স কম সময়ে সহজে প্রয়োজনীয় জীন বাছাই করে আমাদের কাজ অনেকাংশে এগিয়ে দিতে পারে। কোন জীবের যে জীনটা আমাদের দরকার  তা খুব সহজেই এর মাধ্যমে খুজে পেতে পারি এবং সেটা অন্য কোন প্রানির উন্নতিকল্পে ব্যাবহার করতে পারি, আবার ক্ষতিকত জীনকে আমরা বন্ধ করে দিতে পারি। এটি আবার তিন প্রকার, Functional Genomics – কোন জীনের কি কাজ সেটা সম্পর্কে ভবিষ্যৎবানী করে, Structural Genomics – জীনের গঠন ও খুজে পেতে সাহায্য করে  এবং Nutritional Genomics – পুষ্টির সাথে সম্পর্কিত জীনগুলো সম্পর্কে তথ্য সরবরাহ করে।

প্রোটিওমিক্স (Proteomics): আমরা জানি একটা ডীএনএকে তখনই জীন বলা হয় যখন সেটা কোন নির্দিস্ট প্রোটিন তৈরি করতে পারে। জীন থেকে আরএনএ এবং আরএনএ থেকে প্রোটিন। প্রোটিন তৈরি হয় বিভিন্ন অ্যামাইনো এসিডের নির্দিষ্ট পর্যায়ক্রমিক সমন্বয়ে। কম্পিউটারের সাহায্যে প্রোটিন ডাটা নিয়ে কাজ করাই প্রোটিওমিক্স। এক্ষত্রে একটা প্রোটিনে কোন কোন অ্যামাইনো এসিড আছে এবং তাদের পর্যায়ক্রম নিয়ে বিশ্লেষন করা হয়। প্রোটিনের গঠন সম্পর্কে ভবিষ্যৎবানী করা হয়। বিভিন্ন জীবে প্রাপ্ত একই প্রটিনে অ্যামাইনো এসিডের ক্রম নিয়ে গবেষনা এবং প্রোটিনের বিবর্তন নিয়ে কাজ করা হয়।

ড্রাগ ডিজাইন (Drug Design): ড্রাগ আমাদের দেহে কাজ করে কারো নির্দেশে নয় বরং বিভিন্ন অনুর মধ্যকার মিথস্ক্রিয়া ও রাসায়নিক বিক্রিয়া মাধ্যমে। এজন্য ড্রাগ তৈরি করার সময় কম্পিউটারে সিমুলেশন করে দেখা হয় এটি প্রকৃতপক্ষে কতটা কার্যকর হবে। প্রত্যেক ড্রাগের একটি সুনির্দিষ্ট টার্গেট অনু থাকে যেটার সাথে বন্ধন তৈরি করে এবং তাকে নিষ্ক্রিয় করে। বায়োইনফর্মেটিক্স এক্ষেত্রে ড্রাগের নকশা তৈরি করতে সাহায্য করে। ফলে আমরা দেহে প্রয়োগের আগেই বুঝতে পারি, কোন ড্রাগের প্রভাব কেমন হবে বা এর কোন ক্ষতিকর প্রভাব আছে কিনা!

ফাইলোজেনেটিক্স (Phylogenetics): ডারউইনের ভুত বিজ্ঞানীদের কখনো পিছু ছাড়েনাই। ফসিল থেকে শুরু করে বিজ্ঞানের এমন কোন শাখা নেই যেখানে বিবর্তন থিওরি অকার্যকর প্রমানিত হয়েছে। আনবিক জীন বিজ্ঞান বা জেনেটিক্সে এই ভুতের প্রভাব মনে হয় সবথেকে বেশি। জিন বা জিনোম সিকুয়েন্স করার পর থেকে এটা প্রমাণিত যে এই পৃথিবীর প্রতিটা জীব একই সুতায় বাধা। দুটো জীবের মধ্যকার দূরত্ব ততটাই যতটা তাদের জীনের মধ্যকার অমিল। বায়োইনফর্মেটিক্সের মাধ্যমে বিভিন্ন জীবের জীনের মধ্যকার এই পার্থক্য বিশ্লেষন করে আমরা বুঝতে পারি তাদের মধ্যে সম্পর্ক এবং তাদের উৎপত্তি সংক্রান্ত বিভিন্ন তথ্য। এর মাধ্যমে আমরা Tree of Life তৈরি করতে পারি।

ওমিক্স সম্প্রদায় (Omics): বায়োইনফর্মেটিক্স আজ বহুদুর পৌছে গেছে, শুরুতে শুধু ডিএনএ, আরএনে এবং প্রোটিন নিয়ে কাজ করা হলেও। আজকাল বায়োইনফর্মেটিক্স দিয়ে কোষের সাথে কোষের মিথস্ক্রিয়া, বায়োলজিকাল পাথওয়ে, এমআরএনে প্রোফাইল, এমনকি কোন অণুজীবের কালচার না করেও তার জীন নিয়ে বিশ্লেষন করা সম্ভব হচ্ছে। এসব কাজকে তাই নতুন করে শ্রেণীবিভাগ করার প্রয়োজনীয়তা দেখা দিয়েছে, Metagenomics, Metabolomics, Cellinomics এবং Transcriptomics নামক বেশ কিছু নতুন শাখা উদ্ভুত হতে যাচ্ছে। এগুলোকে একত্রে Omics সম্প্রদায় বলে।

যাহোক বায়োইনফর্মেটিক্স জীব বিজ্ঞানের নবীন শাখা হলেও এর দাপট বিজ্ঞানীরা ইতোমধ্যে বুঝতে শুরু করেছেন। বায়োইনফর্মেটিক্স এখন অনেক জনপ্রিয়, সত্যি বলতে বায়োইনফর্মেটিক্সে এক্সপার্ট মানুষ এখনো বেশ কম। জীব বিজ্ঞান ও কম্পিউটার বিজ্ঞানের মিলনেই বায়োইনফর্মেটিক্স উদ্ভুত কিন্তু এই দুটো প্রান্তিক বিষয়ে একসাথে জানা বেশ শক্ত আর এ কারনেই বায়োইনফর্মেটিক্সে এক্সপার্ট হওয়া একটু কঠিন। তবু মানুষের অসাধ্য কিছু নাই, সময় থাকতে লেগে পড়ুন, পরিশ্রম বিফলে যাবেনা।

লেখাটি ব্যাক ইন স্টাডিতে প্রকাশিতঃ লেখাটির লিংক এখানে

Advertisements

2 thoughts on “বায়োইনফর্মেটিক্সে হাতে খড়ি

মন্তব্য করুন...

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s