Wednesday, November 11, 2015

জীবজগতের ভাষা, বর্ণমালা ও তার উৎস


[বি.দ্র.: এই লেখাতে মূলত জীবজগতের গাঠনিক ভাষা নিয়ে আলোচনা করা হয়েছে।]

ছোটবেলায় আমাদের অনেকের মা-বাবা আমাদের বর্ণমালা শেখানোর জন্য এক ধরণের খেলনা কিনে দিতেন। প্লাস্টিকের তৈরী চৌকা (বর্গক্ষেত্র) আকৃতির খেলনাগুলোতে বর্ণমালার বিভিন্ন অক্ষর লিখা থাকতো। উদ্দেশ্য, আমরা খেলাচ্ছলে বর্ণমালা শিখে নেবো। সাথে, বর্ণ ব্যবহার করে শব্দ গঠনও করতে পারবো।

ধরুন, আপনাকে এ ধরণের কয়েক সেট বর্ণমালা দেয়া হয়েছে। বর্ণমালায় স্বরবর্ণ ও ব্যাঞ্জন বর্ণের পাশাপাশি ‘কার’ চিহ্নিত চৌকা আছে। এ অবস্থায় আপনি সবগুলো চৌকা হাতে নিয়ে যদি টেবিলে ফেলেন তাহলে কি অর্থপূর্ণ বাক্য গঠন হওয়ার কোন সম্ভাবনা আছে? অবশ্যই না। হ্যাঁ, হতে পারে অর্থপূর্ণ ছোট দু’একটি শব্দ হয়ে গেল। যেমন: বল, কলম ইত্যাদি। কিন্তু, শব্দে অক্ষরের এবং ‘কার’-এর সংখ্যা যতই বাড়বে ততই ‘বাই চান্স’ অর্থপূর্ণ শব্দ তৈরী হওয়ার সম্ভাবনা কমে যাবে। যেমন: ‘আকাশ’ ও ‘হতবিহ্বল’ শব্দ দু’টিতে যথাক্রমে ৫টি ও ৭টি চৌকা লাগবে। অন্যদিকে, ‘বল’ ও ‘কলম’ শব্দ দু’টিতে যথাক্রমে ২টি ও ৩টি চৌকা লাগবে। ফলে, ‘আকাশ’ ও ‘হতবিহ্বল’ শব্দ দুটি বাই চান্স তথা র‍্যাণ্ডমলি হওয়ার সম্ভাবনা কমে যাবে।

আবার, চৌকাগুলো র‍্যাণ্ডমলি ফেললে যদি কতগুলো অর্থপূর্ণ শব্দ তৈরী হয়েও যায়, তথাপি তা একটি অর্থপূর্ণ বাক্য গঠন করবে না। যেমন: মনে করি, টেবিলে দেখা গেলো ‘বল কলম আকাশ’, এটা কোন অর্থপূর্ণ বাক্য প্রকাশ করলো না। তবে, এক্ষেত্রেও ছোট ছোট অর্থপূর্ণ বাক্য প্রকাশ পেয়ে যেতে পারে। যেমন: আমি যাই। কিন্তু বাক্য যতই বড় হবে ততই র‍্যাণ্ডমলি তৈরী হয়ে যাওয়ার সম্ভাবনা কমে যাবে।

উপরের চিত্রে দেখা যাচ্ছে যে চৌকাগুলো র‍্যাণ্ডমলি ফেলে রাখা হয়েছে তাতে দু’অক্ষরের একাধিক অর্থপূর্ণ শব্দ (যেমন: GO, TO) পাওয়া যাচ্ছে। ভালমত খুঁজলে দু-একটি তিন অক্ষরের অর্থপূর্ণ শব্দও পাওয়া যেতে পারে। তবে, চার অক্ষরের যে শব্দটি (LOVE) ওপরের দিকে আছে, তা দেখামাত্রই বলে দেয়া যায় যে কেউ একজন এগুলো এভাবে সাজিয়েছে, র‍্যাণ্ডমলি হয়নি। চার অক্ষরের দুটো শব্দ মিলে যে শব্দটি (HAND-MADE) তৈরী করেছে সেটি র‍্যাণ্ডমলি হওয়া যে প্রায় অসম্ভব, তা বলাই বাহুল্য।

এবার মনে করুন, আপনার চৌকাগুলোতে এক বিশেষ ধরণের চুম্বক লাগানো আছে, যাতে আপনার চৌকাগুলোর একটি আরেকটির সাথে সুনির্দিষ্ট তথা স্পেসিফিক নিয়মে লেগে যাওয়ার প্রবণতা আছে। ধরি, ‘ক’ চিহ্নিত চৌকার প্রবণতা হলো ‘ল’ এর সাথে পাশাপাশি লেগে যাওয়া। তাহলে, এ ধরণের বর্ণমালা দিয়ে ‘বাই চান্স’ তো দূরে থাক, আপনি নিজে থেকে কি কোন শব্দ লিখতে পারবেন? উত্তর: না। কারণ, ‘ক’-এর পরে ‘স’ যুক্ত করতে প্রয়োজন হলেও আপনি আটকে যাবেন। কিন্তু, চৌকাগুলোর প্রবণতা যদি এমন হতো যে একটির সাথে আরেকটি স্পেসিফিক ভাবে না লেগে পাশাপাশি যেকোন বর্ণের সাথে হালকা ভাবে লাগে, তাহলে আপনার যেকোন শব্দ তৈরী করতে কোন সমস্যা হতো না এবং র‍্যাণ্ডমলি যে ছোট শব্দ বা বাক্যগুলো হতো সেগুলোও সাধারণ চৌকার মত বিচ্ছিন্ন না থেকে একটু লেগে থাকতো, অর্থাৎ স্থায়ী হতো। তবে এক্ষেত্রে ‘বাই চান্স’ হওয়া মানে আরেক সমস্যা। কারণ, দেখা যেত, যখনই ‘কলম’ লেখাটা তেরী হয়েছে পরক্ষণেই ‘ব’ এবং ‘শ’ বা অন্য যেকোন অক্ষর পাশে এসে ‘বকলমশ’ বানিয়ে ফেলেছে, তথা অর্থহীন করে ফেলেছে। অর্থাৎ, এমতাবস্থায় অর্থপূর্ণ শব্দগুলোকে পাশাপাশি রাখার জন্য একজন বুদ্ধিমান ব্যক্তির সার্বক্ষণিক অবস্থান প্রয়োজন হয়ে পড়ত।

উপরের আলোচনা থেকে আমরা কয়েকটি গুরুত্বপূর্ণ বিষয় বুঝতে পারলাম তা হলো:

১. আমরা যদি কোন প্রক্রিয়ায় কোন তথ্য সংরক্ষণ করতে চাই, সেই প্রক্রিয়াটিতে এমন কতিপয় পৃথক পৃথক অংশ থাকবে যেগুলোকে যেকোন ভাবে সাজানো যায়।

২. উক্ত অংশগুলোর পরস্পরের মধ্যে আকর্ষণ থাকতে পারে, কিন্তু সুনির্দিষ্ট ‘আকর্ষণ’ থাকা যাবে না।

৩. এ ধরণের পৃথক পৃথক অংশগুলো র‍্যাণ্ডমলি যুক্ত হয়ে অর্থপূর্ণ কোন শব্দ এবং বাক্য গঠন করার একটি সীমা আছে। তবে, সেই সীমা খুবই সংকীর্ণ তথা ছোট।

এবার আসুন এ ধরণের একটি তথ্যসংরক্ষণ ব্যবস্থা সম্পর্কে জানি যা প্রতিনিয়ত আমরা ব্যবহার করে চলেছি। তা হলো কম্পিউটার। হ্যাঁ, কম্পিউটারে ‘বাইনারী’ নাম্বার দিয়েই বিভিন্ন ধরণের তথ্য, যেমন: প্রোগ্রামের নির্দেশনা, ডকুমেন্ট, ইমেজ ইত্যাদি সংরক্ষণ করা হয়।

আমরা জানি, আমরা যে অংক ব্যবহার করে হিসেব নিকেশ করি সেটি হলো ‘দশমিক’ বা ‘ডেসিমাল’ সংখ্যা। অর্থাৎ, ১ থেকে ১০ পর্যন্ত গিয়ে এরপর আবার ১,২,৩..  যোগ করে তথা ১১, ১২, ১৩… এভাবে সংখ্যা গননা করতে থাকি। কিন্তু সংখ্যা গননা ইচ্ছা করলে এভাবেও করা যায়, ১,১১,১১১,১১১১,…..,১১১১১১১১১১ (তথা ১,২,৩,৪,…….১০)। একে বলে ‘ইউনারী’ সংখ্যা। এভাবে একশ লিখতে গেলে পরপর একশটি ১ বসাতে হবে। অর্থাৎ এভাবে হিসেব করা সহজ হলেও স্থান অনেক বেশী দরকার হয়ে পড়ে। আবার, সংখ্যাকে ‘দ্বিমিক’ বা ‘বাইনারী’ আকারেও প্রকাশ করা যায়। অর্থাৎ, ০,১,১০,১১,১০০,….১০১০ (তথা, ০,১,২,৩,৪,….১০)। দেখা যাচ্ছে এভাবে সংখ্যা প্রকাশ করলে যায়গা তুলনামূলক কম লাগছে। ‘দশমিক’ সংখ্যাকে ‘দ্বিমিক’ সংখ্যায় রূপান্তর করা যায় আবার বিপরীতটাও করা যায়।

লক্ষ্যণীয়, বিদ্যুতের উপস্থিতি অনুপস্থিতির উপর ভিত্তি করে আমরা ইচ্ছে করলে দ্বিমিক সংখ্যাকে সংরক্ষণ করতে পারি। সিলিকন ট্রানজিস্টরের মধ্যে এ ধরণের একটি পদ্ধতি তৈরী করা হয়। যেখানে বিদ্যুতের উপস্থিতি হচ্ছে ‘১’ এবং বিদ্যুতের অনুপস্থিতি ‘০’। এভাবে তৈরীকৃত অনেকগুলো ট্রানজিস্টরকে যদি একসাথে পাশাপাশি রাখা যায় তাহলে সেগুলোতে সংখ্যা সংরক্ষণ করা যাবে।

কিন্তু কতগুলো ট্রানজিস্টরকে একসাথে রেখে আমরা একটি ‘একক’ ধরবো? কারণ, যদি একটি ট্রানজিস্টরকে একক ধরি তাহলে মাত্র দুটো সংখ্যা সংরক্ষণ করা যাচ্ছে ০ এবং ১। কিন্তু যদি ৮টি ট্রানজিস্টরকে একত্রে রাখা যায় তাহলে সর্বোচ্চ যে সংখ্যাটি রাখা যাবে তা হলো: ১১১১১১১১, দশমিকে যার মান ২৫৫। তুলনামূলক বড় সংখ্যা। আরও বেশী ট্রানজিস্টরকে একত্রে রাখা সম্ভব, কিন্তু সেক্ষেত্রে জায়গা বেশী লেগে যাবে। ফলে, সাধারণত ৮টি ট্রানজিস্টরকে একত্রে রাখা হয়। এর প্রতিটিকে এক ‘বিট’ বলে এবং পুরো ৮টি বিটকে একত্রে বলে ‘বাইট’।


চিত্রে একটি ৮ বিট শিফট রেজিস্টার দেখা যাচ্ছে। ৮ বিটের মেমোরী আইসিগুলোও (ইন্টেগ্রেটেড সার্কিট) অনেকটা এভাবেই সাজানো হয়।

৮টি বিট দিয়ে না হয় সংখ্যা সংরক্ষণ করা যায়। কিন্তু, আমি যদি অক্ষর সংরক্ষণ করতে চাই? তা-ও সম্ভব। কীভাবে? এটা বুঝা যায়, সাংকেতিক ভাষা ব্যবহারের উদাহরণ থেকে। আমরা অনেকেই ছোট বেলায় এরকম খেলেছি যে, আমি একটি শব্দ লিখব তবে সে শব্দে ‘খ’ বলতে ‘ক’ বুঝাবো এবং এভাবে বর্ণমালার অক্ষরগুলোকে এক অক্ষর করে পিছিয়ে দেবো। এভাবে কোন শব্দ লিখলে আমি কী ধরণের নিয়ম ব্যবহার করেছি সেটি যে জানবে তার পক্ষে শব্দটির অর্থ বুঝা সহজ হবে। অর্থাৎ, আমরা ইচ্ছে করলে ‘ক’ বর্ণটিকে অন্য কিছু দিয়ে প্রকাশ করতে পারি। ঠিক একইভাবে, একটি বাইটের মধ্যে যদি বিভিন্নভাবে বর্ণমালাকে জুড়ে দেয়া যায় তাহলেও লেখা সংরক্ষণ করা যাবে। American Standard Code for Information Interchange, সংক্ষেপে ASCII হচ্ছে এ ধরণের একটি নীতিমালা যেটি অনুযায়ী কম্পিউটারের বিভিন্ন ইন্সট্রাকশনগুলো, যেমন: ‘কী-বোর্ডের’ বিভিন্ন ‘কী’-গুলো  বাইনারী নাম্বারের সাথে চিহ্নায়িত করা থাকে। (http://www.ascii-code.com/) অর্থাৎ, আপনি যখন কী-বোর্ডে ‘A’ লিখেন,  র‍্যামে তা ‘০১০০০০০১’ হিসেবে সংরক্ষিত হয়।

আমেরিকান স্ট্যাণ্ডার্ড কোড ফর ইনফরমেশন ইন্টারচেঞ্জ। লক্ষ্যণীয়, A-এর কোড হচ্ছে ‘1000001’। এখানে ৭টি বিট আছে। প্রথম বিটটিকে (তথা অষ্টম) রাখা হয় অংকের মাইনাস বা প্লাস বুঝানোর জন্য।

হার্ডডিস্কে কীভাবে সংরক্ষণ হয়? বিষয়টি খুবই মজার। আমরা জানি, চৌম্বক পদার্থগুলোর ভিতরে ডাইপোল থাকে। তড়িৎক্ষেত্র প্রবাহিত করে যেগুলোর পোলারিটি ঘুরিয়ে দেয়া যায়। এরকম ক্ষুদ্র ক্ষুদ্র ঘনকাকৃতির চৌম্বক পদার্থ (যেমন: হার্ডডিস্কে ব্যবহৃত কোবাল্ট ভিত্তিক সংকর ধাতু)-কে যদি পাশাপাশি সাজানো যায় তাহলেও বাইনারী ডিজিট সংরক্ষণ করা যাবে। সেক্ষেত্রে ধরুন: ‘>’-কে ‘এক’ এবং ‘<’ কে ‘শূণ্য’ ধরা হলো। সেক্ষেত্রে, ‘A’ লিখলে হার্ডডিস্কে তা ‘<><<<<<>’ এভাবে সংরক্ষিত থাকবে।


চিত্রে হার্ডডিস্কের কোবাল্ট বেজ্‌ড্‌ ম্যাগনেটিক অ্যালয় দিয়ে কীভাবে বাইনারী তথ্য রেকর্ড করা এবং পড়া হয় তা দেখা যাচ্ছে।

যাই হোক, এবার লক্ষ্য করুন, হার্ডডিস্কে কিংবা র‍্যামে আমরা ডাটা সংরক্ষণ করতে পারছি কারণ ডাটা সংরক্ষণের ক্ষুদ্র অংশগুলো পরস্পরের সাথে সুনিদিষ্ট আকর্ষণে আবদ্ধ নয়। স্পষ্টতই, হার্ডডিস্কের উপর দিয়ে যদি কোন র‍্যাণ্ডম ম্যাগনেটিক ঝড় বয়ে যায় সুনির্দিষ্ট কোন তথ্য সংরক্ষণ হবে না। আবার, র‍্যাণ্ডম প্রক্রিয়ায় যদি একটি বিট পরিবর্তন হয়ে যায়, গুছানো তথ্য ধ্বংস হবে এবং একটি নির্দিষ্ট সংক্ষিপ্ত সীমার বাইরে অর্থবহ তথ্য যুক্ত হবে না।

এবার চলুন আমরা এরকম আরও মজার একটি বর্ণমালা নিয়ে কথা বলি। হ্যাঁ, তা আর কিছু নয় জীবজগতের গাঠনিক ব্লুপ্রিন্ট সংরক্ষণকারী বর্ণমালা- ‘ডিএনএ’।

ডিএনএ-র বর্ণমালায় বর্ণ মাত্র চারটি এবং কোন যতি চিহ্ন নেই। এডেনিন (A), থায়ামিন (T), গুয়ানিন (G) এবং সাইটোসিন (C)। এই চারটি অণু এমন যে, এগুলো পরস্পর পাশাপাশি ফসফেট বন্ধনে যুক্ত হয়। কিন্তু, এই বন্ধনে যুক্ত হওয়ার ক্ষেত্রে তাদের পারস্পরিক স্পেসিফিক এফিনিটি কাজ করে না। স্পেসিফিক এফিনিটি কাজ করলে ডাটা সংরক্ষণ করা যায় না, উপরে আমরা তা দেখেছি। লক্ষ্যণীয় যে, উপরোক্ত প্রতিটি অনুকে বলে নাইট্রোজেন বেজ। উক্ত নাইট্রোজেন বেজগুলো ডিঅক্সিজেনেটেড রাইবোজ-এর সাথে সংযুক্ত থাকে, যাদেরকে বলে নিউক্লিওসাইড। প্রতিটি নিউক্লিওসাইডের রাইবোজ সুগারে ফসফেট যুক্ত হলে গঠিত হয় নিউক্লিওটাইড। মূলত এই নিউক্লিওটাইড-ই হলো ডি-অক্সিরাইবো-নিউক্লিইক-এসিড তথা  ডিএনএ-র গাঠনিক একক। অর্থাৎ, এরকম একেকটি নিউক্লিওটাইড অণু পাশাপাশি যুক্ত হয়ে যে পলিনিউক্লিওটাইড চেইন গঠন করে তাকেই বলে ডিএনএ।

আমরা চিত্রটির ডানদিকে ডিএনএ ডাবল হেলিক্স-এর অংশ দেখতে পাচ্ছি। বামদিকে দেখানো হয়েছে যে, ডিএনএ-তে কীভাবে নিউক্লিওটাইডগুলো পরস্পরের সাথে সংযুক্ত হয়। লক্ষ্যণীয়, ডাবল হেলিক্স গঠনের ক্ষেত্রে পাশাপাশি দুটো চেইনের একটির A অপরটির T এর সাথে এবং একটির C অপরটির G এর সাথে ও ভাইস ভারসা হাইড্রোজেন বন্ধন দিয়ে যুক্ত হয়।

প্রশ্ন হলো, ATGC বর্ণগুলোকে তো বিভিন্ন ভাবে সাজানো যেতে পারে, সেক্ষেত্রে আমরা তথ্য সংরক্ষণের একক হিসেবে কোনটি ঠিক করবো? এটি নির্ভর করছে আমি কী ধরণের তথ্য সংরক্ষণ করতে চাই এবং কী ধরণের ‘সংকেত’ চিহ্নিত করতে চাই তার উপর। উপরের কম্পিউটারের উদাহরণে আমরা দেখেছি, বাইনারী ডিজিটে বর্ণ দুটি, ‘০’ এবং ‘১’। আমি যদি দুটি নিয়ে একক করি তাহলে সাজানো যাবে এইভাবে: ০০,০১,১০,১১; তিনটি করে নিলে: ০০০,০০১,০১০,০১১,১০০,১০১,১১০,১১১; অর্থাৎ খুব বেশী সংকেত চিহ্নিত করা যাবে না। অন্যদিকে, আমি যেহেতু অনেকগুলো পৃথক নির্দেশনা বা অক্ষর চিহ্নিত করতে চাচ্ছি, সেহেতু ‘একক’টি এমন হলে ভাল হয় যে বেশী বড়ও না আবার এমন ছোটও না যে সবগুলো সংকেত সংরক্ষণ করা যাবে না। এ হিসেবে কম্পিউটারের একক হলো ‘০০০০০০০০’ তথা ‘৮’ বিট।

ডিএনএ-র ক্ষেত্রে আমার সংকেতগুলো হলো অ্যামাইনো এসিড। যদিও প্রকৃতিতে অনেক অ্যামাইনো এসিড আছে, আমি বিশটির বেশী ব্যবহার করবো না। এখন, ATGC থেকে যদি দুটো করে বর্ণ নিই, তাহলে মাত্র ষোল ভাবে সাজানো যায়: AA,AT,AG,AC,TA,TT,TG,TC,GA,GT,GG,GC,CA,CT,CG এবং CC। অর্থাৎ বিশটি অ্যামাইনো এসিডকে নির্দেশিত করতে পারছি না। চারটি করে নিলে সাজানো যাবে ২৫৬ ভাবে। এত বেশী একক আমার প্রয়োজন পড়ছে না। তদুপরি, চারটি করে সাজালে আমার জায়গা বেশী লেগে যাচ্ছে।  কিন্তু, তিনটি করে নিলে ৬৪ উপায়ে সাজানো যায়। এ প্রক্রিয়ায় ২০টি অ্যামাইনো এসিডকে খুব সহজেই চিহ্নায়িত করা যাচ্ছে। এছাড়াও, অনেকগুলো অ্যামাইনো এসিডকে আমি একাধিক ‘কোডন’ দিয়ে চিহ্নিত করতে পারছি। (লক্ষ্যণীয়, ডিএনএ-তে ৩টি অক্ষরের এই একককে কোডন বলে)।


প্রশ্ন হলো, আমি একটি অ্যামাইনো এসিডের বিপরীতে কোন্ কোডনকে চিহ্নায়িত করবো? যেমন: GGG কোড করে গ্লাইসিনকে, GAG কোড করে গ্লুটামিক এসিডকে। কিন্তু, GGG এলানিনকে কোড না করে গ্লাইসিনকে কোড করবে এটা কেন নির্ধারণ করবো?  ওয়েল, এক্ষেত্রে আমার পরিকল্পনা হবে কোষ বিভাজন হওয়াকালীন ডিএনএ কপি করার সময় যদি র‍্যাণ্ডমলি একটি অক্ষর পরিবর্তন হয়ে যায় (মিউটেশন) সেক্ষেত্রে অ্যামাইনো এসিড যেন পরিবর্তন না হয় (সাইলেন্ট মিউটেশন)। আবার, বিশ ধরণের অ্যামাইনো এসিডে কতগুলো পোলার, কতগুলো নন-পোলার, কতগুলো এসিডিক এবং কতগুলো বেসিক, কতগুলোতে ‘রিং’ আকৃতির সাইড চেইন আছে কতগুলোতে নেই। প্রোটিনের ত্রিমাত্রিক গঠন নির্মাণ এবং ফাংশন নির্ধারণে এই বিভিন্ন ধরণের অ্যামাইনো এসিডগুলোর সুনির্দিষ্ট গাঠনিক ও রাসায়নিক ভূমিকা আছে। এ কারণে আমি চেষ্টা করবো কোডনগুলো এমনভাবে নির্ধারণ করতে যেন মিউটেশনের কারণে যদি অ্যামাইনো এসিড পরিবর্তন হয়েও যায়, তথাপি যেন একই ধরণের অন্য একটি এমাইনো এসিডে পরিবর্তন হয়। মজার বিষয় হলো, জীবজগতে যে কোডন পাওয়া গেছে তা এই ধরণের বৈশিষ্ট্যগুলোকে মাথায় রেখে নির্ধারণ করা হয়েছে। তদুপরি, জীবজগতের প্রায় সকল ক্ষেত্রেই এই কোডনের নীতিমালা সুনির্দিষ্ট অর্থাৎ ইউনিভার্সাল। কারণটা খুব সহজ- একাধিক ভাষা ব্যবহার করার চেয়ে একটি  ভাষা ব্যবহার করাই সুবিধাজনক।

উপরে আমরা ইউনিভার্সাল জেনেটিক কোডের চার্ট দেখতে পাচ্ছি। লক্ষ্য করলে দেখা যাবে, কোডন সিস্টেমটি এমনভাবে সিলেক্ট করা হয়েছে যেন মিউটেশনের ইফেক্ট সর্বোচ্চ মিনিমাইজ করা যায়। উদাহরণস্বরূপ, ফিনাইল এলানিনকে (Phe) কোড করে UUU এবং UUC। অর্থাৎ UUU মিউটেশন হয়ে UUC হয়ে গেলেও এমাইনো এসিড একই থাকবে। আবার, যদি UUU পরিবর্তন হয়ে UAU হয়ে যায় তাহলে ফিনাইল এলানিন পরিবর্তন হয়ে টাইরোসিন (Tyr) হবে, যা কাছাকাছি গঠনযুক্ত। কিংবা, যদি CUU হয়ে যায় সেক্ষেত্রে হচ্ছে লিউসিন (Leu)। এটিও ত্রিমাত্রিক গঠনের দিক দিয়ে ফিনাইল এলানিনের কাছাকাছি।

এই যে একটি কোডনের সাথে একটি অ্যামাইনো এসিডকে আমি ‘অ্যাসাইন’ করছি, তা কি র‍্যাণ্ডমলি একা একা হতে পারবে? যে কোন সচেতন পাঠকের কাছে পরিস্কার যে তা সম্ভব নয়। প্রকৃতপক্ষে, একটি বিষয়ের সাথে আরেকটি বিষয়কে এসাইন বা সম্পর্কযুক্ত করার তথা একটি বিষয়ে আরেকটি বিষয়ের অর্থ নির্ধারণ করে দেয়া ‘বুদ্ধিমান’ স্বত্তার কাজ। কোন অন্ধ প্রক্রিয়ায় তা কখনও হয় না। এর মধ্যে আবার তা যদি হয় ‘অপটিমাম’ বা ‘বেস্ট’ কোডন নির্ণয় করা, তাহলে তো আরও সম্ভব নয়।

এছাড়াও, এই বর্ণগুলো যদি পরস্পরের সাথে স্পেসিফিক এফিনিটি দেখাতো তাহলেও তথ্য সংরক্ষণ করা সম্ভব হতো না। অর্থাৎ, A কেবল G-এর পাশে বসতে পারবে, C কেবল T-এর পাশে বসতে পারবে, অণুগুলোর রাসায়নিক আসক্তি এমন হলে তা কোন অ্যামাইনো এসিডকে কোড করতে পারতো না।

এবারে আসি প্রোটিনের কথায়। প্রোটিনকেও আরেক ধরণের ভাষা বলা যায় যার বর্ণমালায় বর্ণ আছে ২০টি। পোলারিটি, অম্ল-ক্ষার বৈশিষ্ট্য, বেনজিন রিং-এর উপস্থিতি ইত্যাদি বৈশিষ্ট্যের আলোকে প্রতিটি অ্যামাইনো এসিড বর্ণ বিভিন্ন অর্থ ধারণ করে। আর এই বৈশিষ্ট্যকে কাজে লাগিয়ে তৈরী হয় একেকটি বাক্য তথা অ্যামাইনো এসিডের সরলরৈখিক সিকোয়েন্স। একে আবার প্রোটিনের প্রাইমারী স্ট্রাকচার বলা হয়। উক্ত সিকোয়েন্স, অ্যামাইনো এসিডের বিভিন্ন মাত্রার কেমিক্যাল এফিনিটির উপর ভিত্তি করে আলফা হেলিক্স, বিটা শিট ইত্যাদি বিশেষায়িত গঠন তৈরী করার মধ্য দিয়ে প্রোটিনের সেকেণ্ডারী স্ট্রাকচার তৈরী করে। এরপর, নির্দিষ্ট আকৃতিতে ভাঁজ (ফোল্ড) হয়ে তৈরী করে সুনির্দিষ্ট ত্রিমাত্রিক গঠন বা টারসিয়ারী স্ট্রাকচার। এ রকম দুটো বা ততোধিক প্রোটিন সমন্বয়ে তৈরী হয় কোয়ার্টারনারী স্ট্রাকচার। এনজাইমগুলো সাধারণত একটি প্রোটিন দিয়ে গঠিত হয়, আর বিভিন্ন গাঠনিক কাঠামো যেমন: আয়ন চ্যানেল তৈরী হয় একাধিক প্রোটিনের সমন্বয়ে।

ইলাস্ট্রেশনটিতে আমরা দেখতে পাচ্ছি জীবজগতে প্রাপ্ত ২১ ধরণের এমাইনো এসিড। তন্মধ্যে, সেলেনোসিস্টিন অল্প কিছু বিশেষায়িত প্রোটিনে পাওয়া যায় বিধায় সাধারণভাবে প্রোটিনের গাঠনিক একক পড়ার সময় এর উল্লেখ দেখা যায় না।

লক্ষ্যণীয়, কম্পিউটারের ভাষার ক্ষেত্রে আমরা দেখেছি বাইনারী ভাষা দিয়ে ইংরেজী ভাষা সংরক্ষণ করা হয়। অন্যকথায়, একটি ভাষা দিয়ে আরেকটি ভাষা সংরক্ষণ করা যায়। তেমনি প্রোটিনের ভাষাকে সংরক্ষণ করে ডিএনএ-র ভাষা। আরও লক্ষ্যনীয়, প্রোটিনের ভাষায় বর্ণ ২০টি হওয়ায় এবং উক্ত বর্ণগুলোর আণবিক বৈশিষ্ট্য বিভিন্ন হওয়ায় ভাব প্রকাশের সীমানা অনেক বেড়ে গেলো। অর্থাৎ প্রোটিনের ২০টি অণু দিয়ে অনেক বৈচিত্রপূর্ণ ত্রিমাত্রিক গঠন সম্ভব। ফলে, প্রোটিন এনজাইম থেকে শুরু করে কোষের বিভিন্ন গাঠনিক উপাদান তৈরীতে ভূমিকা রাখে। কিন্তু, ডিএনএ-র বর্ণমালার বর্ণের আণবিক বৈশিষ্ট্য ও সংখ্যা সীমিত হওয়ায় ডিএনএ বৈচিত্রপূর্ণ ত্রিমাত্রিক গঠন তৈরী করতে পারে না।

ছবিতে দেখা যাচ্ছে কীভাবে অ্যামাইনো এসিডগুলো একটার পাশে আরেকটা যুক্ত হয়ে চূড়ান্ত ত্রিমাত্রিক প্রোটিন তৈরী করে। বিষয়টি যত সহজ শুনতে ততটাই কঠিন বাস্তবে, কী বলেন?

আমরা জানি, ডিএনএ-তে দুটি পলিনিউক্লিওটাইড চেইন পাশাপাশি থেকে প্যাঁচানো মই-এর মত গঠন তৈরী করে, যাকে ইংরেজীতে বলে ডাবল হেলিক্স। ডিএনএ থেকে প্রোটিন তৈরীর প্রক্রিয়ায় প্রথমে ডিএনএ থেকে সম্পূরক ম্যাসেঞ্জার আরএনএ তৈরী হয়। এ প্রক্রিয়ায় শুরুতে ডিএনএ ডাবল হেলিক্স এর মধ্যে বন্ধন খুলে একটি চেইনকে পড়ার জন্য উন্মুক্ত করতে হয়। এ প্রক্রিয়াটি করে একটি বিশেষায়িত প্রোটিন তথা এনজাইম। এরপর আরেকটি বিশেষায়িত এনজাইম এসে উক্ত চেইনকে পড়ে সম্পূরক আরএনএ চেইন তৈরী করে। অতঃপর, একটি এনজাইম লাগে উন্মুক্ত করা অংশ পুনরায় জোড়া লাগাতে, একটি এনজাইম লাগে প্রুফ রিড করতে, দুটি লাগে জোড়া লাগানোর সময় বেশী পেঁচিয়ে গেলে প্যাঁচ খুলতে। প্রসঙ্গত, আরএনএ-এর সাথে ডিএনএ-র পার্থক্য হল- আরএনএ-এর নিউক্লিওটাইডে তথা আরএনএ-র বর্ণমালার অক্ষরগুলোতে একটি অক্সিজেন অণু বেশী থাকে এবং আরএনএ-তে থাইমিনের (T) পরিবর্তে ইউরাসিল (U) থাকে। প্রশ্ন আসা স্বাভাবিক যে, তথ্য পরিবহন করে নেয়ার জন্য ডিএনএ-র পরিবর্তে আরএনএ-কে কেন বাছাই করা দরকার হলো? একটি উত্তর হলো, যে পদ্ধতিটির মধ্যে আমি গুরুত্বপূর্ণ তথ্য রাখতে চাই স্বাভাবিক ভাবেই তাকে আমি আলাদাভাবে সংরক্ষণ করতে চাইব। তদুপরি, আরএনএ-র আরেকটি বৈশিষ্ট্য হলো এটি ডিএনএ-র চেয়ে একটু বেশী বৈচিত্রের গঠন তৈরী করতে পারে।

এক নজরে ডিএনএ থেকে প্রোটিন সংশ্লেষ পদ্ধতি। ছবিটিতে সংশ্লেষের কাজে অংশগ্রহণকারী এনজাইমগুলোকে দেখানো হয়নি।

এরপর, ম্যাসেঞ্জার আরএনএ থেকে রাইবোজোম নামক আণবিক মেশিনের সহায়তায় প্রোটিন সংশ্লেষ হয়। রাইবোজোম নামক মেশিনটি তৈরী হয় রাইবোজোমাল আরএনএ ও অনেকগুলো প্রোটিনের সমন্বয়ে। প্রোটিন তৈরীর প্রক্রিয়ায় আর এক ধরণের আরএনএ সাহায্য করে- ট্রান্সফার আরএনএ বা টি-আরএনএ । এদের কাজ হলো রাইবোজোমের কাছে অ্যামাইনো এসিড বহন করে নিয়ে যাওয়া। বিশটি অ্যামাইনো এসিডের জন্য এরকম বিশ ধরণের সুনির্দিষ্ট ট্রান্সফার আরএনএ থাকে। আবার, প্রত্যেক ধরণের টি-আরএনএ-র সাথে তৎসংশ্লিষ্ট অ্যামাইনো এসিড সংযুক্ত করার জন্য বিশটি সুনির্দিষ্ট ও পৃথক এনজাইম (অ্যামাইনো এসাইল ট্রান্সফারেজ) থাকে। এছাড়াও, রাইবোজোমে দুটো পাশাপাশি অ্যামাইনো এসিডের  বন্ধন তৈরী করার জন্য কাজ করে আলাদা এনজাইম।

উপরের বর্ণনা থেকে লক্ষ্যণীয়, ডিএনএ-তে প্রোটিন তৈরী তথ্য ধারণ করা থাকে। আবার, উক্ত তথ্যকে কাজে লাগিয়ে প্রোটিন তৈরী করার জন্য দরকার অনেকগুলো আরএনএ এবং সুনির্দিষ্ট প্রোটিন (এনজাইম)।  যদি প্রশ্ন করা হয়, কীভাবে আদিম পরিবেশে কোষের উদ্ভব হল? স্বাভাবিকভাবেই প্রশ্ন চলে আসে, কোন্‌টা আগে আসলো- ডিএনএ নাকি প্রোটিন নাকি আরএনএ? আমরা দেখছি তিনটি জিনিস একসাথে ও পরস্পরজড়িতভাবে উদ্ভব না হলে এই সিস্টেমটি চালুই হচ্ছে না। ইনটুইটিভলি, কোন প্রকার র‍্যাণ্ডম অনিয়ন্ত্রিত প্রক্রিয়ায় তা সম্ভব নয়।

প্রোটিন (তথা এনজাইম) আগে আসবে? রিডিং টেমপ্লেট (অর্থাৎ ডিএনএ) না থাকলে প্রোটিন কাজ করবে কার উপর? তদুপরী, ১৫০টি অ্যামাইনো এসিড দিয়ে নির্মিত একটি মাঝারি সাইজের সুনির্দিষ্ট প্রোটিন আসাও গাণিতিকভাবে অসম্ভব একটি ব্যাপার। ডগলাস এক্স-এর হিসেবে অনুযায়ী এর সম্ভাব্যতা ১০১৬৪। [১] অন্যদিকে, বিল ডেম্বস্কি দেখিয়েছেন বিশ্বজনীন সম্ভাব্যতার সীমা ১০১৫০। [২] অর্থাৎ, যে কোন র‍্যাণ্ডম ঘটনা এই সীমাকে ছাড়িয়ে গেলে আমাদের মহাবিশ্বে তা ঘটার সম্ভাবনা নেই। একটি মাঝারি সাইজের প্রোটিনের এই অবস্থা। অথচ, আরএনএ পলিমারেজ এনজাইম ১০০০-এর বেশী অ্যামাইনো এসিড যুক্ত তিনটি প্রোটিনের সমন্বয়ে গঠিত হয়।

ডিএনএ আগে আসবে? ডিএনএ থেকে তথ্য পড়বে কে? যদি ডিএনএ অণু এমন কোন গঠন তৈরী করতে সক্ষম হত যা এনজাইমের মত কাজ করে তাহলেও চিন্তা করার সুযোগ থাকতো। কিন্তু, আমরা আগেই বলেছি ডিএনএ বৈচিত্রপূর্ণ গঠন তৈরী করতে পারে না। সুতরাং বাকী রইল আরএনএ। আরএনএ কি কেমিকেল এভল্যুশন তথা এবায়োজেনেসিসকে উদ্ধার করতে পারবে?

বিজ্ঞানীরা ল্যাবরেটরীতে এমন এক ধরণের আরএনএ সংশ্লেষ করতে পেরেছেন যা নিয়ন্ত্রিত ও সুনির্দিষ্ট পরিবেশে এনজাইম হিসেবে কাজ কোরে আরএনএ পলিমারাইজেশনেকে প্রভাবিত করতে পারে। অর্থাৎ, একটি সম্পূরক আরএনএ টেমপ্লেট-এর বিপরীতে নিউক্লিওটাইড (A এর বিপরীতে U, U এর বিপরীতে A, G এর বিপরীতে C, এবং C এর বিপরীতে G) যোগ করার মাধ্যমে নিজের একটি কপি তৈরী করতে পারে। এই বিশেষ ধরণের আরএনএকে বলে রাইবোজাইম। এর মাধ্যমে তারা বলতে চাচ্ছেন যে, আদিম পরিবেশে এ ধরণের একটি রাইবোজাইম আসার মাধ্যমে সেল্ফ-রেপ্লিকেশনের সূচনা হয়েছে এবং পরবর্তীতে ‘কোন একটি উপায়ে’ কোষের উপরোক্ত বর্ণিত বিষয়গুলো আবির্ভাব হয়েছে! যেকেউ একটু মাথা খাটালেই বুঝবে এ ধরণের চিন্তা কতখানি অ্যাবসার্ড! কিন্তু কেন?

এক, পৃথিবীর আদিম পরিবেশ ল্যাবরেটরীর মত নিয়ন্ত্রিত ছিলো না।

দুই, ‘রাইবোজাইম নিজের একটি কপি তৈরী করতে পারে’ এই অবস্থা থেকে ‘আরএনএ প্রোটিনের তথ্য ধারণ করে এবং তা প্রোটিন সংশ্লেষ করে’ এই অবস্থায় যাওয়ার কোন পথ নেই। কারণ, উপরে আমরা ডিএনএ-র ক্ষেত্রে যে রকম বলেছি ঠিক তেমনি কোন্ কোডনটি কোন্ অ্যামাইনো এসিডের জন্য নির্ধারিত হবে সেটি নির্বাচন করা একটি বুদ্ধিমান ‘মাইণ্ড’-এর কাজ। তদুপরি, যদি অপটিমাম ইউনিভার্সাল কোডনের জন্য র‍্যাণ্ডম অনুসন্ধান করা সম্ভবও হতো, সেক্ষেত্রে প্রতি সেকেণ্ডে ১০৫৫টি অনুসন্ধান চালাতে হতো। কিন্তু, বায়োফিজিসিস্ট হার্বাট ইওকি হিসেব করে দেখিয়েছেন র‍্যাণ্ডম অনুসন্ধান প্রক্রিয়ায় ১.৪০ x ১০৭০টি সম্ভাব্য কোডনের মধ্যে উক্ত অপটিমাম কোডন সিস্টেমকে খুঁজে বের করতে হবে এবং হাতে সময় পাওয়া যাবে ৬.৩ x ১০১৫ সেকেণ্ড। [৩] এছাড়াও, রাইবোজোমে যে প্রোটিন সিনথেসিস হয় তাতে অনেকগুলো সুনির্দিষ্ট প্রোটিন ও আর-আরএনএ-র নির্দিষ্ট অবস্থানগত ও তড়িৎ-রাসায়নিক ভূমিকা আছে। অথচ, আরএনএ প্রোটিনগুলোর মত বিভিন্ন ধরণের স্ট্রাকচার গঠন করতে পারে না। কারণ, আরএনএ-র বর্ণ সংখ্যা সীমিত এবং বর্ণের কেমিক্যাল স্ট্রাকচারও অ্যামাইনো এসিডের ন্যায় বৈচিত্রপূর্ণ নয়।

তিন, রাইবোজাইম নিজের কপি করতে পারে তখনই যখন তার সম্পূরক একটি টেমপ্লেট থাকে। অর্থাৎ, আদিম পরিবেশে সেল্ফ রেপ্লিকেটিং রাইবোজাইম আসতে হলে রাইবোজাইম ও তার সম্পূরক টেমপ্লেট দুটো অণুরই একসাথে আসতে হবে। জনসন ও তার সহকর্মীরা দেখিয়েছেন যে, আংশিকভাবে নিজের কপি তৈরী করতে পারে এরকম একটি রাইবোজাইমের নিউক্লিওটাইডের সংখ্যা ১৮৯। সুতরাং, উক্ত স্পেসিফিক রাইবোজাইম এবং তৎসংশ্লিষ্ট সম্পূরক ও সুনির্দিষ্ট টেমপ্লেট-এর একসাথে আসার সম্ভাব্যতা ৪১৮৯ x ৪১৮৯ তথা ৪(১৮৯+১৮৯=৩৭৮) তথা প্রায় ১০২৭৭, যা বিশ্বজনীন সম্ভাব্যতার সীমা ১০১৫০ কে ছাড়িয়ে যায় (অর্থাৎ, অসম্ভব)। অথচ, পুরোপুরি কপি করতে পারে এরকম একটি রাইবোজাইমে নিউক্লিওটাইড সংখ্যা লাগবে আরও বেশী।  অন্যদিকে, অর্গেল ও জয়েস দেখিয়েছেন যে, এরকম দুটি আরএনএ খুজে পাওয়ার জন্য ১০৪৮ টি অণু খুঁজতে হবে যা পৃথিবীর মোট ভরকে অতিক্রম করে যায়। [৪] অর্থাৎ, আমরা দেখতে পেলাম আরএনএ এবায়োজেনেসিসকে উদ্ধার করতে কোন অবস্থাতেই সক্ষম নয়।

উপরের দীর্ঘ আলোচনার মধ্য দিয়ে আমরা তথ্য প্রকাশের অন্যতম মাধ্যম ভাষার স্বতন্ত্র বৈশিষ্ট্য সম্পর্কে জানতে পারলাম। ভাষার ব্যবহারে ইন্টেলিজেন্স-এর গুরুত্ব সম্পর্কে অভহিত হলাম। জীবজগতের ভাষার সৌষ্ঠব, বৈচিত্র ও সৌন্দর্যকে উপলব্ধি করতে সক্ষম হলাম। পরিশেষে, এ সিদ্ধান্তে এসে উপনীত হলাম যে, কোন প্রকার অন্ধ, র‍্যাণ্ডম, অনিয়ন্ত্রিত, বস্তুগত ও প্রাকৃতিক প্রক্রিয়ায় জীবজগতের ভাষার আগমন অসম্ভব এবং  জীবজগতের ভাষার আগমন ঘটাতে দরকার একজন বুদ্ধিমান স্বত্তার কার্যক্রম।

রেফারেন্স:
১. Meyer SC. Signature in the Cell. HarperCollins Publisher Inc. 2009; Page: 172

২. Dembsky WA. The Design Inference. Cambridge University Press. 1998; Page: 209

৩. Rana F. The Cell’s Design. Baker Books. 2009; Page: 175

৪. Stephen C. Meyer. Signature in the Cell. HaperCollins Publisher Inc. 2009; Page: 250