वेब सर्च करना | How to search the web?
Table of Contents
वेब सर्च (web search) करना सूचना प्राप्त करने का एक तरीका है। इसका उद्देश्य उन सभी प्रासंगिक दस्तावेजों की प्राप्ति है जो हमारी जिज्ञासा से संबंधित हैं।
लेकिन इसमें कुछ गैर प्रासंगिक दस्तावेज भी प्राप्त हो सकते हैं।
वेब सर्च एक सर्च इंजन के द्वारा ही संभव हैं।
सर्च इंजन क्या हैं? | What is search Engine ?
एक वेब सर्च इंजन वह सॉफ्टवेयर है जिसे वर्ल्ड वाइड वेब (www) से संबंधित सूचनाओं को प्राप्त करने के लिए बनाया गया है।
सर्च रिजल्ट को सामान्यतः परिणामों की एक सूचि के रूप में प्रस्तुत किया जाता है जिसे ‘सर्च इंजन रिजल्ट पेज’ (SERP- Search Engine Result Page) कहा जाता है।
सूचना वेब पेज (Web Page), छवियों (Images) और अन्य कई तरह की फाइलों का मिश्रण हो सकती है।
कुछ सर्च इंजन डाटा बेस अथवा ओपन डायरेक्ट्रीज से भी डाटा माईन करते हैं।
एक सर्च इंजन वास्तविक समय में निम्नलिखित प्रक्रियाओं को संभालता है –
- वेब क्रोलिंग/ वेब स्पाइडर | Web Crawling/Web Spider
- इंडेक्सिंग | Indexing
- सर्चिंग | Searching
वेब क्रोलिंग/ वेब स्पाइडर | Web Crawling/Web Spider
एक वेब क्राउलर वह इंटरनेट बोट (bot) है जो वेब अनुक्रमण के लिए वर्ल्ड वाइड वेब को व्यवस्थित तरीके से ब्राउज करता है।
सर्च इंजन वेब क्राउलिंग या स्पाइडर सोफ्टवेयरों का उपयोग अपनी वेब कंटेंट (सामग्री) अनुक्रमण को अद्यतन बनाने के लिए करते हैं।
वेब क्राउलर विजिट किए गए सभी पृष्ठों की प्रतिलिपि तैयार कर प्रस्तुत कर सकता है, जिसके डाउनलोड किए गए पेजों को बाद में सर्च इंजन द्वारा अनुक्रमित किया जा सकता है जिसे उपयोगकर्त्ता और अधिक कुशलता से खोज सकता है।
इंडेक्सिंग | Indexing –
अनुक्रमण का अर्थ वेब-पेज पर पाए गए संबंधित की-वर्ड और परिभाषित हो सकने वाले टोकनो को उनके डोमेन-नाम और एचटीएमएल फिल्ड से जोड़ना है।
इनका जोड़ (combination) सार्वजनिक डेटा बेस में किया जाता है जो वेब सर्च क्वेरी के लिए उपलब्ध रहता है।
यूजर द्वारा एक शब्द के रूप में भी क्वेरी की जा सकती है।
इंडेक्स संबंधित सूचनाओं को शीघ्र से शीघ्र खोजने में मदद करता है।
सामान्यतः जब कोई यूजर सर्च इंजन में कोई क्वेरी दर्ज करता है तो वह कुछ शब्दों का समूह होता है।
इंडेक्स में निहित तौर पर उन सभी वेबसाइट के नाम होते हैं जहाँ क्वेरी शब्दों के की-वर्ड होते हैं एवं
उन्हें तत्काल या क्षणिक तौर पर इंडेक्स से प्राप्त किया जा सकता है।
वास्तविक प्रोसेसिंग लोड (Processing load) इन वेबपेज (खोजे गए परिणामों) को सूचीबद्ध करने में लगता है।
सर्चिंग | Searching
सर्च इंजन की उपयोगिता परिणामों की प्रासंगिकता पर निर्भर करती है।
उसी शब्द/शब्दांशों से संबंधित जानकारी लाखों वेबसाइटों पर उपलब्ध हो सकती है
इसलिए उनमें से कुछ पेज दूसरों की तुलना में क्वेरी से अधिक प्रासंगिक एवं लोकप्रिय हो सकते हैं।
अधिकतर सर्च इंजन परिणामों की रैंकिंग करके सबसे अच्छे परिणामों को सर्च रिजल्ट के रूप में प्रस्तुत करते हैं।
कौन सा पेज सबसे ज्यादा मैच करता है या किस क्रम में परिणामों को दिखाया जाना है
यह सुनिश्चित करने की प्रक्रिया हरेक सर्च इंजन में अलग-अलग होती हैं।
शोध के अनुसार, आज सबसे ज्यादा लोकप्रिय सर्च इंजन जिन्हें इंटरनेट समुदायों द्वारा अत्यधिक काम में लिया जा रहा है वो इस प्रकार हैं –
- गूगल | Google
- बिंग | Bing
- याहू | Yahoo
गूगल सर्च (Google Search) जिसे सामान्यतः गूगल वेब सर्च या गूगल कहकर संबोधित किया जाता है,
गूगल इनकारपोरेशन का एक वेब सर्च इंजन है।
यह वर्ल्ड वाइड वेब पर सबसे ज्यादा इस्तेमाल होने वाला सर्च इंजन है, जिसमें हर रोज तीस करोड़ से अधिक सर्च किए जाते हैं।
गूगल के सर्च-रिजल्ट पेज का आर्डर “पेज-रैंक” नामक पेटेंटेड प्रायोरिटी रैंक अल्गोरिथम पर आधारित है।
गूगल सर्च का मुख्य उद्देश्य वेब सर्वर पर सार्वजनिक रूप से उपलब्ध दस्तावेजों में शब्दों की खोज करना है
ना कि डेटाबेस में उपलब्ध चित्र या डाटा में खोजना।
विकिपीडिया | Wikipedia –
विकिपीडिया एक मुक्त विश्वकोष है, जिसे उन लोगों द्वारा सहयोगात्मक रूप से लिखा है जो इसका उपयोग करते हैं।
यह एक विशेष प्रकार की वेबसाइट है जो सहभागिता को आसान बनाने के लिए डिज़ाइन की गई है, जिसे विकी कहा जाता है।
विकी वेबसाइट पर उपलब्ध पिछले लेखकों के द्वारा काम किए गए लेख को किसी के द्वारा भी सम्पादित करने, हटाने या संशोधित करने की अनुमति देता है।
ये भी पढ़ें –