Google का लक्ष्य हमेशा दुनिया की जानकारी व्यवस्थित करना है, और इसका पहला लक्ष्य व्यावसायिक वेब था। अब, यह वैज्ञानिक समुदाय के लिए डेटासेट के लिए एक नए खोज इंजन को लांच कर रहा है।
डाटासेट सर्च नामक सेवा, आज लॉन्च की गई है, और यह अकादमिक अध्ययन और रिपोर्ट की कंपनी के लिए लाभदायक है। संस्थान जो विश्वविद्यालयों और सरकारों जैसे ऑनलाइन अपना डेटा प्रकाशित करते हैं, उन्हें अपने वेबपृष्ठों में मेटाडेटा टैग शामिल करने की आवश्यकता होगी जो उनके डेटा का वर्णन करते हैं। इस जानकारी को तब Google के खोज इंजन द्वारा अनुक्रमित किया जाएगा और ज्ञान ग्राफ से जानकारी के साथ संयुक्त किया जाएगा।
ऑनलाइन डेटा के संगत दुनिया को एकजुट करने के लिए एक खोज इंजन
Google एआई के एक शोध वैज्ञानिक नताशा नोय ने डेटासेट सर्च बनाने में मदद की, का कहना है कि लक्ष्य ऑनलाइन डेटासेट के लिए हजारों अलग-अलग भंडारों को एकजुट करना है। नोय कहते हैं, “हम उस डेटा को खोजने योग्य बनाना चाहते हैं, लेकिन इसे कहां रखें।”
फिलहाल, डेटासेट प्रकाशन बेहद खंडित है। अलग-अलग सरकारों और स्थानीय अधिकारियों के रूप में विभिन्न वैज्ञानिक डोमेन की अपनी पसंदीदा भंडार होती है। “वैज्ञानिक कहते हैं, ‘मुझे पता है कि मुझे अपने डेटासेट खोजने के लिए कहां जाना है, लेकिन यह वही नहीं है जो मैं हमेशा चाहता हूं,’ ‘नोय कहते हैं। “एक बार जब वे अपने अद्वितीय समुदाय से बाहर निकल जाएंगे, तब यह मुश्किल हो जाएगा।”
नोय ने हाल ही में एक ऐसे जलवायु वैज्ञानिक का उदाहरण दिया जो उसने उससे कहा था कि वह आगामी अध्ययन के लिए समुद्र के तापमान पर एक विशिष्ट डेटासेट की तलाश में थी लेकिन उन्हें वह कहीं भी नहीं मिला।
टेनिसन कहते हैं, बस लोगों को खोजना महत्वपूर्ण है … वे किस प्रकार की शर्तों का उपयोग करते हैं, वे उन्हें कैसे व्यक्त करते हैं। “अगर हम डेटा के लिए खोज करते हैं और इसे अधिक सुलभ बनाते हैं, तो यह बहुत अच्छा होगा, अगर Google इस पर अपना डेटा सर्च प्रदान करता है तो यह बहुत अच्छा होगा।”
दूसरे शब्दों में: Google को डेटासेट खोज के बारे में एक डेटासेट प्रकाशित करना चाहिए जिसे डेटासेट खोज द्वारा अनुक्रमित किया जाएगा।