Cara Kerja Search Engine Mencari Berita
Search Engine merupakan situs penyedia jasa pencarian berdasarkan kata kunci yang dimasukkan oleh pengunjung. Search engine menjadi situs yang paling sering dikunjungi, karena memudahkan para pengunjung dalam mencari informasi pengetahuan dan berita di dunia yang luas ini. Google, Yahoo!, Altavista, Lycos sebagai contoh search engine yang paling sering digunakan para pengunjung.
Melalui search engine, pengunjung dapat dengan mencari berita dengan sangat mudah. Pengunjung hanya memasukkan kata kunci, kemudian mengklik tombol "GO", "Search", "Find", atau tombol lainnya yang memiliki arti sama, lalu dalam sekejap search engine akan menampilkan ratusan bahkan ribuan halaman situs yang relevan dengan kata kunci yang dimasukkan tadi.
Pengunjung sangat mudah mencari berita dengan hanya memasukkan kata kunci saja, namun sebenarnya proses pencarian itu sangat rumit. Proses yang rumit itu bisa menjadi cepat dan mampu menampilkan halaman situs hingga ratusan karena beberapa hal, antara lain:
1.Pengumpulan Kata Kunci
Search engine harus memiliki banyak daftar kata kunci agar dapat menampilkan sesuai dengan yang dicari. Spider merupakan suatu perangkat lunak untuk mengumpulkan seluruh kata yang muncul di halaman web. Spider menjelajah ribuan halaman web, dimulai dari server-server yang paling sering digunakan dan halaman-halaman web yang populer atau sering dikunjungi oleh pengguna internet. Kemudian spider akan mengikuti link yang ditemukan pada halaman itu. Pencarian ini dinamakan Web Crawling.
Ketika spider menjelajahi sebuah halaman web, spider akan mengambil kata-kata yang ada di halaman itu dan letak kata-kata itu, bisa dari judul, sub judul, meta tag, atau bagian-bagian lain dari halaman itu. Cara spider menjelajahi halaman tidak selalu sama pada beberapa search engine seperti pada spider milik search engine Google mengambil kata-kata yang memiliki arti dan mengabaikan kata-kata seperti “a", “an” dan “the”.
Begitu pula dengan spider search engine Lycos, spidernya memeriksa seluruh kata-kata di judul, subjudul dan link untuk seratus kata yang paling sering digunakan di sebuah halaman web, serta dua puluh baris pertama dari teks. Sedangkan spider search engine Altavista mengumpulkan semua kata-kata tanpa terkecuali dan untuk melengkapinya, spider mencocokkan hasil pencariannya dengan meta tag.
2.Meta Tag
Meta Tag merupakan tempat dimana pemilik halaman bisa menentukan kata kunci yang mewakili isi halamannya. Meta tag ini diselipkan di kode HTML namun tidak akan muncul di browser. Adanya meta tag ini akan membantu search engine menampilkan hasil yang tepat bagi penggunanya.
Meta tag akan sangat membantu apabila kata kunci dari sebuah halaman situs memiliki arti lebih dari satu. Pemberian meta tag dapat membantu search engine memilih arti yang tepat dari kata itu. Namun walaupun meta tag dapat sangat membantu, ternyata ketergantungan yang berlebihan terhadap meta tag dapat berbahaya. Misalnya seorang membuat website dengan memasukkan kata yang terlalu umum pada meta tag, sehingga membuat halaman websitenya sering muncul jika kata itu diketikkan. Padahal isi situs tersebut tidak relevan dengan kata kunci yang diberikan. Ini akan mengakibatkan kerja search engine yang tidak maksimal. Untuk mengatasi kejadian seperti ini, biasanya spider akan membandingkan meta tag dengan isi halaman. Isi meta tag yang tidak sesuai dengan isi halaman akan diabaikan.
3.Membuat Indeks
Informasi yang diperoleh dari spider disimpan oleh search engine agar dapat digunakan. Ada dua kunci yang digunakan dalam pembuatan indeks, yaitu data yang ada dalam informasi dan metode pembuatan indeks. Semuanya bertujuan untuk menampilkan hasil yang tepat kepada pengguna search engine. Selain itu, search engine juga menyimpan sebuah kata yang muncul di sebuah halaman hingga beberapa kali, bagaimana kedalaman sebuah kata dan berbagai hal lainnya. Kata kunci yang dipilah dengan baik akan membantu searh engine menampilkan halaman yang tepat.
Melihat kemampuan search engine mengumpulkan informasi, tentu diperlukan suatu kapasitas penyimpanan yang sangat besar untuk menyimpan informasi tersebut. Namun sebelum disimpan, melalui suatu metode sendiri yaitu di-encode agar penyimpanan dapat lebih efisien, sehingga pencarian dapat dilakukan lebih cepat.
Ada beberapa cara yang digunakan untuk membuat indeks, tetapi yang paling sering digunakan untuk membuat indeks pada search engine adalah teknik hashing yaitu pemberian nilai tertentu pada setiap kata. Nilai tersebut diberikan berdasarkan berapa banyak kata tersebut digunakan di internet. Kombinasi antara pengindeks-an yang efentif dan kapasitas penyimpanan yang kecil akan mebuat search engine dapat melakukan pencarian dengan cepat.
Poin-poin di atas menjadi pokok search engine dalam mencari berita, mendapatkan informasi yang benar serta cepat. Apabila search engine hanya menampilkan sedikit situs yang berelvan dengan kata kunci yang dimasukkan, itu artinya kata kunci masih belum populer atau bahkan kata kunci yang dimasukkan termasuk rumit bagi search engine.
Melalui search engine, pengunjung dapat dengan mencari berita dengan sangat mudah. Pengunjung hanya memasukkan kata kunci, kemudian mengklik tombol "GO", "Search", "Find", atau tombol lainnya yang memiliki arti sama, lalu dalam sekejap search engine akan menampilkan ratusan bahkan ribuan halaman situs yang relevan dengan kata kunci yang dimasukkan tadi.
Pengunjung sangat mudah mencari berita dengan hanya memasukkan kata kunci saja, namun sebenarnya proses pencarian itu sangat rumit. Proses yang rumit itu bisa menjadi cepat dan mampu menampilkan halaman situs hingga ratusan karena beberapa hal, antara lain:
1.Pengumpulan Kata Kunci
Search engine harus memiliki banyak daftar kata kunci agar dapat menampilkan sesuai dengan yang dicari. Spider merupakan suatu perangkat lunak untuk mengumpulkan seluruh kata yang muncul di halaman web. Spider menjelajah ribuan halaman web, dimulai dari server-server yang paling sering digunakan dan halaman-halaman web yang populer atau sering dikunjungi oleh pengguna internet. Kemudian spider akan mengikuti link yang ditemukan pada halaman itu. Pencarian ini dinamakan Web Crawling.
Ketika spider menjelajahi sebuah halaman web, spider akan mengambil kata-kata yang ada di halaman itu dan letak kata-kata itu, bisa dari judul, sub judul, meta tag, atau bagian-bagian lain dari halaman itu. Cara spider menjelajahi halaman tidak selalu sama pada beberapa search engine seperti pada spider milik search engine Google mengambil kata-kata yang memiliki arti dan mengabaikan kata-kata seperti “a", “an” dan “the”.
Begitu pula dengan spider search engine Lycos, spidernya memeriksa seluruh kata-kata di judul, subjudul dan link untuk seratus kata yang paling sering digunakan di sebuah halaman web, serta dua puluh baris pertama dari teks. Sedangkan spider search engine Altavista mengumpulkan semua kata-kata tanpa terkecuali dan untuk melengkapinya, spider mencocokkan hasil pencariannya dengan meta tag.
2.Meta Tag
Meta Tag merupakan tempat dimana pemilik halaman bisa menentukan kata kunci yang mewakili isi halamannya. Meta tag ini diselipkan di kode HTML namun tidak akan muncul di browser. Adanya meta tag ini akan membantu search engine menampilkan hasil yang tepat bagi penggunanya.
Meta tag akan sangat membantu apabila kata kunci dari sebuah halaman situs memiliki arti lebih dari satu. Pemberian meta tag dapat membantu search engine memilih arti yang tepat dari kata itu. Namun walaupun meta tag dapat sangat membantu, ternyata ketergantungan yang berlebihan terhadap meta tag dapat berbahaya. Misalnya seorang membuat website dengan memasukkan kata yang terlalu umum pada meta tag, sehingga membuat halaman websitenya sering muncul jika kata itu diketikkan. Padahal isi situs tersebut tidak relevan dengan kata kunci yang diberikan. Ini akan mengakibatkan kerja search engine yang tidak maksimal. Untuk mengatasi kejadian seperti ini, biasanya spider akan membandingkan meta tag dengan isi halaman. Isi meta tag yang tidak sesuai dengan isi halaman akan diabaikan.
3.Membuat Indeks
Informasi yang diperoleh dari spider disimpan oleh search engine agar dapat digunakan. Ada dua kunci yang digunakan dalam pembuatan indeks, yaitu data yang ada dalam informasi dan metode pembuatan indeks. Semuanya bertujuan untuk menampilkan hasil yang tepat kepada pengguna search engine. Selain itu, search engine juga menyimpan sebuah kata yang muncul di sebuah halaman hingga beberapa kali, bagaimana kedalaman sebuah kata dan berbagai hal lainnya. Kata kunci yang dipilah dengan baik akan membantu searh engine menampilkan halaman yang tepat.
Melihat kemampuan search engine mengumpulkan informasi, tentu diperlukan suatu kapasitas penyimpanan yang sangat besar untuk menyimpan informasi tersebut. Namun sebelum disimpan, melalui suatu metode sendiri yaitu di-encode agar penyimpanan dapat lebih efisien, sehingga pencarian dapat dilakukan lebih cepat.
Ada beberapa cara yang digunakan untuk membuat indeks, tetapi yang paling sering digunakan untuk membuat indeks pada search engine adalah teknik hashing yaitu pemberian nilai tertentu pada setiap kata. Nilai tersebut diberikan berdasarkan berapa banyak kata tersebut digunakan di internet. Kombinasi antara pengindeks-an yang efentif dan kapasitas penyimpanan yang kecil akan mebuat search engine dapat melakukan pencarian dengan cepat.
Poin-poin di atas menjadi pokok search engine dalam mencari berita, mendapatkan informasi yang benar serta cepat. Apabila search engine hanya menampilkan sedikit situs yang berelvan dengan kata kunci yang dimasukkan, itu artinya kata kunci masih belum populer atau bahkan kata kunci yang dimasukkan termasuk rumit bagi search engine.
0 comments:
Post a Comment
Terima kasih telah memberikan komentar