ClickHouse, startup database analitik real-time open source yang terpisah dari Yandex pada tahun 2021, pada hari Selasa mengumumkan bahwa mereka telah mengakuisisi PeerDB, sebuah perusahaan yang fokus pada replikasi Postgres yang hemat biaya dan change data capture.
Sejak diluncurkan, bahkan sebelumnya, selama waktu mereka sebagai proyek open source yang didukung oleh Yandex, ClickHouse telah membuat namanya terkenal sebagai gudang data real-time untuk perusahaan-perusahaan besar. Daftar pelanggan mereka termasuk Deutsche Bank, eBay, Fastly, GitLab, HubSpot, Microsoft, ServiceNow, dan Spotify. Dan meskipun ClickHouse telah menawarkan konektor Postgres untuk membantu bisnis memindahkan data mereka dari database relasional populer ke database analitik mereka, namun PeerDB menawarkan peningkatan kecepatan hingga 10x serta sejumlah fitur khusus yang sebelumnya tidak ditawarkan oleh ClickHouse.
“Kami memulai perjalanan kami dengan membangun alat ETL pergerakan data dengan fokus yang tajam pada Postgres. Kami mulai dengan niche ini untuk menyediakan cara terbaik di dunia untuk mereplikasi data dari Postgres ke gudang data. […] Kami merilis konektor ClickHouse sekitar enam bulan yang lalu, dan sejak itu, konektor tersebut terus berkembang dan sekarang adalah yang paling cepat tumbuh, melampaui gudang data lain seperti Snowflake dan BigQuery,” kata pendiri dan CEO PeerDB Sai Srirampur kepada saya. Sebelum memulai PeerDB, Srirampur bekerja pada layanan PostgreSQL Azure setelah Microsoft mengakuisisi Citus Data, di mana ia sebelumnya bekerja.
Srirampur mengatakan bahwa ia selalu ingin PeerDB fokus pada 'kualitas daripada kuantitas', yang membawa timnya fokus sepenuhnya pada membangun alat ETL khusus untuk Postgres. Ini termasuk muatan awal dari data berukuran terabyte dari database Postgres ke gudang data seperti ClickHouse, tetapi mungkin yang paling penting, juga sistem change data capture, yang memastikan bahwa database asli dan gudang data tetap selaras.
Ternyata, untuk sebagian besar pelanggan PeerDB, Postgres adalah sumber utama data untuk gudang data mereka. Mungkin itu tidak mengherankan, mengingat pelanggan tersebut lebih cenderung memilih layanan seperti PeerDB, tetapi jelas ClickHouse melihat pasar yang berkembang untuk alat seperti ini juga.
“Yang sering kita lihat adalah [pelanggan] menggunakan Postgres sebagai backend transaksional untuk aplikasi yang diperhadapkan ke pelanggan, dan kemudian memindahkan data tersebut ke ClickHouse untuk kasus penggunaan analitik — ini adalah pola yang sangat umum, dan ada sejumlah pelanggan yang menggunakannya,” kata pendiri ClickHouse Yury Izrailevsky kepada saya. “Tentu saja, Postgres adalah teknologi yang sangat kompleks. Ia sangat kuat tetapi membutuhkan pengetahuan mendalam, terutama untuk kasus penggunaan Change Data Capture.”