সার্চ ইঞ্জিন কিভাবে কাজ করে?
সার্চ ইঞ্জিন হলো একটি উত্তরদানকারী যন্ত্র। হাজার হাজার ফ্যাক্টর দিয়ে মূল্যায়ন করার মাধ্যমে ঠিক কোন তথ্যটি ইউজারের সার্চ অনুযায়ী সঠিক, তা খুঁজে বের করে সার্চকারীর সামনে প্রদর্শন করাই এর কাজ।
যে কোন সার্চ ইঞ্জিন এই কাজটি করতে পারে এর সাথে যুক্ত থাকা বিভিন্ন ওয়েবসাইটের তথ্য (যেমন ওয়েব পেজ, ইমেজ, ভিডিও, পিডিএফ ইত্যাদি) ক্রলিং এবং ইনডেক্সিং এর মাধ্যমে। আর যেগুলো তথ্য সার্চকারীর জন্য বেশি উপযোগী, সেগুলো ক্রমান্বয়ে সার্চলিস্টের উপরের প্রদর্শন করে ।
একটি সার্চ ইঞ্জিনে স্পাইডার, রোবট ইত্যাদি বিভিন্ন ধরনের প্রোগ্রাম ব্যবহার করা হয়। আর এইসব প্রোগ্রামই বিভিন্ন ওয়েবসাইট থেকে তথ্য সংরক্ষণ করে এবং হাইপার লিঙ্ক ট্রেস করে।
প্রতিটি সার্চ ইঞ্জিন প্রাথমিকভাবে মূলত তিনটি ধাপ অনুসরণ করে কাজ করে। সেগুলো হলো-
ওয়েব পেজ ক্রল করা
সার্চ রেজাল্ট দেখানোর পূর্বে যে বিষয়টি মূলত ঘটে থাকে তা হলো ক্রলিং। ওয়েব পেজ ক্রলিং হল এমন একটি প্রক্রিয়া যার মাধ্যমে সার্চ ইঞ্জিন কিছু ক্রলার বা রোবট (যাদেরকে স্পাইডারও বলা হয়) ব্যবহার করে একটি নির্দিষ্ট কি-ওয়ার্ডের জন্য একাধিক কন্টেন্টের একটি তালিকা বা ইনডেক্স তৈরি করে থাকে।
এছাড়াও নতুন কন্টেন্ট খোঁজা কিংবা আপডেটেড কন্টেন্টকে তালিকায় একটু উপরে রাখার বিষয়টিও ক্রলার করে থাকে। তবে ক্রলিং এর কাজে বা নতুন কন্টেন্ট খুঁজতে একটি ওয়েব ক্রলার বা স্পাইডার কিছু বিষয় অনুসরণ করে থাকে। যা হলো-
প্রাসঙ্গিকতা
সার্চ ইঞ্জিনে বাস্কেটবল নিয়ে সার্চ করলে আপনাকে কিন্তু ফুটবলের ওয়েবসাইট দেখানো হবে না। আর এটাই হচ্ছে প্রাসঙ্গিকতার মূল ধারণা। আপনি যেই কি-ওয়ার্ড নিয়ে সার্চ করবেন একটি ক্রলার সেই সমন্ধে প্রাসঙ্গিক বিষয়গুলোকেই আপনার সামনে নিয়ে আসবে। তবে এখানে প্রাসঙ্গিক বিষয়ের মধ্যেও কিছুটা ভাগ রয়েছে। যেমন, আমরা যদি IT Nut Hosting তিনটি ওয়ার্ড লিখে সার্চ করি, তবে সার্চগুলো কিছুটা এমন হবে, প্রথমের দিকের ওয়েবসাইটগুলোতে তিনটি একসাথে এবং পরের দিকের ওয়েবসাইটগুলোতে যেকোনো দুইটি বা যেকোনো একটি কি-ওয়ার্ড থাকবে।
অথরিটি
অথোরিটির বিচারের মাধ্যমে একটি নির্দিষ্ট কিওয়ার্ডের জন্য একটি কন্টেন্ট ঠিক কতটা সঠিক ও বিশ্বাসযোগ্য তা নিশ্চিত করা হয়। কিন্তু গুগল কিংবা অন্যান্য সার্চ ইঞ্জিন কিভাবে এটি নিশ্চিত করে ?
আসলে নির্দিষ্ট কিওয়ার্ডের জন্য নির্দিষ্ট কন্টেন্টটি নির্বাচনে, একটি সার্চ ইঞ্জিন লিংকের বিষয়টিই দেখে থাকে। অর্থাৎ আপনার কন্টেন্টের সাথে কতটা প্রাসঙ্গিক লিংক যুক্ত রয়েছে তার উপরেই মূলত এই বিষয়টি নির্ভর করে।
উপকারিতা
গুগলে সার্চ করলেন শেক্সপিয়ারের উপন্যাস নিয়ে। কিন্তু আপনার সামনে আসলো রবীন্দ্রনাথের কবিতা, যেখানে টাইটেল দেয়া শেক্সপিয়ারের উপন্যাস। এতে কি আপনার কোনো উপকার হবে ?
মোটেও না। আর একটি সার্চ ইঞ্জিনও এই বিষয়টি সবসময় মেনে চলে। কনটেন্ট শুধুমাত্র যে প্রাসঙ্গিক ও অথোরিটি মেনে চললেই হবে তা নয়। বরং এর ভেতরের জিনিসগুলো সত্যি একজন সার্চকারীকে সন্তষ্ট করার মতো কিনা সে বিষয়টি মেনেই একটি ওয়েব ক্রলার বা সার্চ ইঞ্জিনের রোবট কাজ করে। এক্ষেত্রে যে কন্টেন্টের প্রাসঙ্গিকতা ও সার্চকারীর উপকারীতার হার যত বেশি হবে, তার র্যাংক করার সুযোগও তত বেশি।
সার্চ ইঞ্জিনে ইনডেক্স করা
কোনো জিনিসকে সার্চ রেজাল্টে নিয়ে আসতে আপনাকে অবশ্যই তা ইনডেক্স করে নিতে হবে। এক্ষেত্রে ইনডেক্স করার অর্থ হচ্ছে গুগলের বা যে কোন সার্চ ইঞ্জিনের সেই বড় ডাটাবেসটিতে আপনার ডাটা যুক্ত করা। আর এই ডাটাগুলোকে সার্চ ইঞ্জিন ক্রলার বিভিন্ন ক্যাটেগরিতে ভাগ করে সার্চ রেজাল্টে আমাদের সামনে নিয়ে আসে। তবে আপনার কন্টেন্ট যদি ইনডেক্স করা না থাকে তাহলে তা ক্রলার এ অদৃশ্যই থেকে যাবে।
এক্ষেত্রে আমরা যেভাবে চাই ঠিক সেভাবেই যদি তা ইনডেক্স করতে যাই তবে নিচের দুটি বিষয় অবশ্যই খেয়াল রাখতে হবে-
URL Inspection Tool- প্রথমেই আমাদের দরকার পড়বে গুগলের এই টুলটি যার মাধ্যমে আমরা আমাদের সাইটটি গুগলের সেই বিশাল ডাটাবেসে যুক্ত করতে পারব। আর কখনো যদি ইনডেক্স হচ্ছে না এমন সমস্যাতে পড়ে যান তাহলে মনে রাখবেন, অবশ্যই ইনডেক্সের জন্য বারবার অনুরোধ করা যায়।
Robots.txt- উপরের টুলটির মাধ্যমে আপনার সব ধরনের কন্টেন্ট বা পেজ গুগলে ইনডেক্স হয়ে যেতে পারে। কিন্তু আপনি কি সব কন্টেন্ট সার্প বা সার্চ রেজাল্টে দেখাতে চাইবেন? নিশ্চয় না। আর বিষয়টি নিশ্চিত করতে robots.txt ফাইলটি ব্যবহার করে ক্রলারকে বুঝিয়ে দিতে পারেন যে তার কোন পেজ ইনডেক্স করা উচিত আর কোনটি নয়। তবে এতে সাইট র্যাংকিং ক্ষতিগ্রস্থ হবার কোন ভয় নেই ।
র্যাংকিং
সার্চ ইঞ্জিনের কার্যাবলির সর্বশেষ ধাপটি হলো র্যাংকিং। আমরা যখন কিছু নিয়ে সার্চ করি, তখন সার্চ ইঞ্জিন ক্রলারগুলো তার পুরো ডাটাবেস অনুসন্ধান করে সবচেয়ে ভালো ও প্রাসঙ্গিক বিষয়টি আমাদের সামনে নিয়ে আসে। আর প্রাসঙ্গিকতার উপর ভিত্তি করে একটি নির্দিষ্ট তালিকা তৈরি করে ফলাফল প্রদর্শনের বিষয়টিকেই র্যাংকিং বলা হয়। তবে এই র্যাংকিং এর ব্যাপারটিও কিছু বিষয় দ্বারা প্রভাবিত। যেমন-
ব্যাকলিংকের প্রাসঙ্গিকতা
ব্যাকলিঙ্ক হচ্ছে আপনার কন্টেন্টে অন্য যেকোন ওয়েবসাইটের লিঙ্ক যুক্ত করা। এক্ষেত্রে আমরা যদি শুধু শুধু অনেক লিঙ্ক যুক্ত করে ফেলি তাহলে কিন্তু ক্রলার তা ধরে ফেলবে এবং আমাদের র্যাংকিংও কমে যাবে। তাই ব্যাকলিঙ্ক দেয়ার বিষয়টি যেন প্রাসঙ্গিক হয় সেদিকে বিশেষ নজর দিতে হবে ।
পেজের গতি
ওয়েবসাইট ঠিক কতটা তাড়াতাড়ি একজন সার্চকারীর সামনে প্রদর্শিত হবে তার উপরেও র্যাংকিং অনেকাংশেই নির্ভর করে। সম্প্রতি একটি পরিসংখ্যানে দেখা গেছে ৪০% লোক ওয়েবসাইটের গতি কম হওয়ার কারণে তা থেকে ফিরে এসেছে। আর এই বিষয়টির উপরেই ক্রলার আপনার সাইটের র্যাংকিং নিশ্চিত করে।
নিয়মিত আপডেট রাখা
আপনি কতটা সময় পর পর আপনার কন্টেন্ট আপডেট করছেন, বা কতদিন আগে করেছিলেন, সে বিষয়টিও বেশ গুরুত্বপূর্ণ । আপনার কন্টেন্টগুলো নিয়মিত আপডেটের সাথে সাথে সমান তালে আপনার ওয়েবসাইটের র্যাঙ্কিং এর ক্রমও বৃদ্ধি পাবে।
মোবাইল ফ্রেন্ডলি
মাঝে মাঝে এমনও হতে পারে যে আমাদের ওয়েবসাইটটি শুধু পিসি কিংবা ল্যাপটপেই প্রদর্শিত হয়, মোবাইলে নয়। এমনটা হলে ওয়েবসাইট র্যাঙ্কিং বেশ ক্ষতিগ্রস্ত হয়। এটা এড়ানোর জন্য আমাদের রিসপনসিভ বা মোবাইল ফ্রেন্ডলি সাইট ব্যবহার করা উচিত। এক্ষেত্রে ওয়েবসাইট টেমপ্লেট বানানোর ক্ষেত্রে বা ওয়েবসাইট ডেভলপমেন্টের ব্যাপারে বিশেষ নজর রাখতে হবে।
No comments
ধন্যবাদ।