Basis data vektor biji pinus sekarang dapat menangani pencarian semantik campuran kata kunci •

Berita23 Views

Ketika Pinecone mengumumkan Vector Database pada awal tahun lalu, dia sedang membangun sesuatu yang dirancang khusus untuk pembelajaran mesin dan ditujukan untuk ilmuwan data. Idenya adalah Anda dapat mengkueri data ini dalam format yang dipahami perangkat, sehingga membuatnya lebih cepat.

Awalnya ini termasuk pencarian semantik di mana pengguna dapat mencari berdasarkan makna daripada kata-kata tertentu. Namun, ternyata dengan orang-orang yang menjalankan Pinecone, ada kasus penggunaan di mana kata kunci tertentu penting, dan hari ini perusahaan mengumumkan bahwa sekarang mungkin untuk melakukan pencarian yang menggabungkan pencarian semantik dan kata kunci, yang oleh pendiri dan CEO perusahaan Edo Liberty disebut pencarian hybrid .

“Kami melakukan banyak penelitian tentang ini dan menemukan bahwa, pada kenyataannya, penelitian campuran menjadi lebih baik [in many cases]. Lebih baik dalam arti bahwa jika Anda dapat menggabungkan kedua pencarian semantik, itu adalah pengkodean mendalam NLP dari kalimat yang mendapatkan konteks, makna, dll., Tetapi Anda juga dapat memasukkannya dengan kata kunci tertentu … kombinasi dari mereka akhirnya menjadi signifikan Liberty lebih baik memberi tahu TechCrunch.

Faktanya, dia mengatakan keduanya saling melengkapi dengan baik, terutama dalam kasus-kasus di mana jargon khusus industri penting. Ini bisa seperti seorang dokter yang mencari kata kunci yang berhubungan dengan penyakit tertentu. Dalam kasus ini, konteks medis dapat memberikan hasil yang lebih baik dengan menggabungkan pertanyaan dan beberapa kata kunci spesifik tentang penyakit tertentu.

Dia mengatakan bahwa kata kunci tidak pernah diprioritaskan daripada pertanyaan semantik yang diajukan pengguna, tetapi kata kunci itu memberikan beberapa informasi tambahan untuk membantu mendapatkan hasil yang lebih bermakna.

“Anda mungkin tahu persis apa yang Anda cari, dan Anda mungkin bisa memberikan semangat ekstra ketika Anda membuat pencarian semantik sadar kata kunci – itu sangat membantu sebenarnya. Jadi saya tidak ingin membuang bagian yang bagus. penelitian kata kunci [by relying completely on semantic search]. Saya tidak ingin kata kunci berada di kursi pengemudi, tetapi saya juga tidak sepenuhnya mengabaikannya.”

Baca juga :  Tweet anti Semit Kanye West menimbulkan pertanyaan tentang hukum Musk di Texas

Seperti yang dikatakan Liberty kepada kami pada saat peluncuran Seri A perusahaan senilai $28 juta tahun lalu, pencarian menjadi kasus penggunaan yang sangat besar bagi perusahaan:

“Penggunaan utama database vektor adalah untuk mencari dan mencari dalam arti kata yang luas. Ini mencari dokumen, tetapi Anda dapat menganggap pencarian sebagai pengambilan informasi umum, penemuan, rekomendasi, deteksi anomali dan sebagainya,” katanya di waktu.

Pinecone diluncurkan pada 2019 dan mengumpulkan $38 juta per Crunchbase.