RADIO NEWS Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

RADIO NEWS Heboh! Induk TikTok Sedang Kumpulkan Data Besar-besaran, Ada Apa?

CHINA – Perusahaan induk TikTok, ByteDance yang berbasis di Tiongkok, tampaknya akan mengikuti perlombaan untuk memproduksi kecerdasan buatan (AI).

Menurut Kasada Research, sebuah perusahaan yang berspesialisasi dalam manajemen bot, mereka baru saja meluncurkan perayap web atau alat pengikis bot mereka sendiri yang disebut Bytespeder pada bulan April 2024. Keberadaan bot tersebut juga dikonfirmasi oleh “dark viewer” yang memantau aktivitas scraping bot tersebut.

Bitspeeder: Scraper Paling Agresif di Internet menunjukkan bahwa Bitspeeder dengan cepat menjadi salah satu scraper paling agresif di Internet. Mesin ini mengumpulkan data jauh lebih cepat dibandingkan perusahaan besar lainnya seperti Google, Meta, Amazon, OpenAI, dan Anthropic, yang menggunakan robot crawler untuk membangun dan meningkatkan model bahasa besar atau model multimodal (LLM/LMM).

“Sejak Bytespeder diluncurkan, ia telah mengumpulkan data hampir 25 kali lebih cepat dibandingkan GPTbot, yang mengumpulkan data untuk platform ChatGPT OpenAI dan model intinya,” jelas CEO Cassada Sam Crowther.

Bytespeder mengumpulkan data 3.000 kali lebih cepat dibandingkan ClaudeBot (Anthropic) yang menjalankan Cloud Platform.

Menurut Casada, peningkatan kinerja crawling membuat Bitspeeder lebih agresif dalam mengumpulkan data. Data menunjukkan bahwa BitSpider telah melihat peningkatan signifikan dalam aktivitas perayapan selama enam minggu terakhir.

Kontroversi Pengikisan Web Pengikisan web telah ada selama beberapa dekade dan terutama dilakukan oleh mesin pencari untuk mengumpulkan tautan dari situs web. Namun, munculnya alat AI buatan telah menambah dimensi baru dan menjadikan praktik ini sebagai sumber litigasi dan kontroversi.

Individu dan organisasi yang karyanya telah dicuri berpendapat bahwa hak cipta mereka telah dilanggar dalam proses tersebut.

Semua model alat AI generatif dilatih pada data online dalam jumlah besar, yang pada dasarnya adalah data apa pun yang tersedia di web, terutama informasi tertulis. Perusahaan teknologi menggunakan bot scraping untuk menyalin semuanya secara gratis dan memasukkannya ke dalam kumpulan data mereka.

ByteDance ditangkap tahun lalu, ByteDance dilaporkan tertinggal jauh dalam perlombaan AI generatif sehingga melanggar persyaratan layanan OpenAI dengan menggunakan OpenAI untuk mengembangkan LLM milik ByteDance sendiri untuk membantu

Awal tahun ini, ByteDance merilis LLM berbasis obrolan yang disebut Doabo, namun pengembangan modelnya selesai sebelum data pelatihan akhir dikumpulkan oleh Bytespeder.

Fungsi pencarian LLM dan TikTok baru Menurut orang dalam perusahaan, ByteDance sedang mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan kinerja pencarian TikTok.

Minggu lalu, TikTok merilis pembaruan pada fitur pencarian iklan yang berfokus pada kata kunci, yang pada dasarnya memungkinkan pengiklan untuk mencari istilah yang sedang tren di TikTok secara real-time.

Hal ini memungkinkan pemasar membuat iklan dengan kata kunci yang relevan, yang akan membantu iklan tersebut muncul di lebih banyak layar pengguna.

Model AI baru mencakup data tentang tren dan topik internet terkini untuk lebih memperluas dan meningkatkan lingkungan pencarian teknologi.

“Mengingat volume pengunjung dan penggunaan, TikTok memiliki lingkungan yang benar-benar dapat dicari berdasarkan kata kunci dan topik, yang akan sangat menarik bagi banyak orang yang menghabiskan banyak uang di Google saat ini,” tulis seorang sumber

Comments

No comments yet. Why don’t you start the discussion?

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *