artwork

Doğru karar için verinizi yapay zeka kontrol etsin

1 yıl önce

0

Hangi işletme, potansiyel müşterileriyle etkileşime geçmek için hatalı verileri kullanmak ister?
Hangi yönetici, kararlarını yanlış veriye dayandırarak almaktan ve şirketin itibarını riske atmaktan hoşlanır?
Hangi şirket, müşteri memnuniyeti ve işletme performansı için doğru verilere sahip olmanın değerini göz ardı edebilir?
Veya biraz daha teknik sorular soralım:
Tablolar zamanında güncellendi mi? 
Zamanında güncellendi ise, tablolarda beklenen veri hacmi ortaya çıktı mı? 
Ortaya çıkan veriler geçerli mi? 
Geçmiş dağılımlara aykırı değerler var mı? Çok fazla boş değer var mıydı?
Kardinalitesi geçmiş değerlerine aykırı mı? Kategorik bir sütun için, kategoriler beklendiği gibi mi, dağılımlarında farklılaşma var mı?

Veri kalitesi günümüz iş dünyasında önemli bir konu haline gelmiştir. Veri kalitesindeki herhangi bir sorun, işletmelerin doğru kararlar vermesini engelleyebilir ve yanlış yönlendirmelere neden olabilir. 
Veri, günümüz iş dünyasında en değerli varlıklardan biridir. Her gün daha fazla veri üretiliyor ve işletmeler bu verileri kullanarak müşterileri daha iyi anlayıp ihtiyaçlarına daha iyi cevap vermeyi hedefliyorlar ancak veri kullanımının en önemli zorluklarından biri, büyük veri kümelerinin işlenmesidir. ETL (Extract, Transform, Load) adı verilen bu süreç, verilerin doğru şekilde işlenmesini ve analiz edilmesini sağlar. Bu süreç oldukça karmaşık ve zaman alıcıdır. En son baktığınız rapor ekranlarındaki veri, önünüze konulan raporlar bu süreçler sonucu oluşur ancak verinin ilk halinden başlayarak yukarıda bahsedilen ETL yolculuğu son haline ulaşması sırasında sistemde meydana gelen kesinti ve sorunlar, yazılımcı hataları gibi nedenlerden dolayı verinin tutarlılığı ve doğruluğunda sorunlar ortaya çıkarır ve bu da birçok konuda riskler, gelir kayıpları ve müşteri ilişkilerinde negatif etkiler doğurur. 

Veri kalitesi sorunlarının şirketlere ciddi maddi kayıplar yaşatabileceğine dair örnekler çoktur. Örneğin; 2016 yılında dünya çapında bir finans kuruluşu, müşteri verilerindeki bir hata nedeniyle 1,2 milyon müşterisinin kişisel bilgilerinin çalınmasıyla sonuçlanan bir veri ihlali yaşadı. Bu olay, kuruluşun itibarını zedeledi ve müşterilerinin güvenini sarsarak şirketin itibarını düşürdü. Benzer şekilde bir e-ticaret şirketi, verilerindeki bir hata nedeniyle ürün stoklarını yanlış yönetti ve sonuçta milyonlarca dolarlık bir stok kaybı yaşadı.

Gartner’ın araştırmalarına göre; veri kalitesi kaynaklı ekonomik kayıpların 3,1 Trilyon USD’ye ulaşabildiği ve şirketlerin yıllık gelirlerinin %23 ünü kaybettiklerini ortaya koyuyor.

Veri kalitesi için bir aksiyon alınmaması veya insan kaynaklarına bağımlı kontroller yapılması birçok olumsuz sonuca neden olabilir. İşletmelerin karşılaşabileceği bazı olumsuz sonuçlar şunlardır:

 1. Yanlış kararlar: Yanlış veya hatalı veriler üzerine kararlar alınması, şirketlerin doğru stratejileri belirleyememesine ve hedeflerine ulaşamamasına neden olabilir.
 2. Müşteri memnuniyetsizliği: Yanlış verilerin kullanılması, müşteri verilerinin kaybolması veya çelişkili verilerin sunulması, müşterilerin memnuniyetsizliğine ve şirket itibarının zarar görmesine yol açabilir.
 3. Maliyet artışı: Hatalı verilerin kullanımı veya yanlış kararların alınması, şirketlerin ek maliyetlere katlanmasına ve iş süreçlerinin etkinliğini azaltabilir.
 4. Kaynak israfı: Veri kalitesi için manuel kontrol yöntemleri kullanılması, zaman ve insan kaynaklarının israfına neden olabilir. Ayrıca manuel kontrol süreçleri, hatalı veya eksik verileri tespit edemeyebilir, bu da veri kalitesinin düşmesi sonucunu doğurabilir.
 5. Rekabet gücü kaybı: Veri kalitesinin düşmesi, şirketlerin rekabet gücünü azaltabilir. Çünkü yanlış veya eksik verilerle yapılan kararlar, rakipler karşısında dezavantaj yaratabilir ve müşterilerin tercihlerinde geri kalınmasına neden olabilir.

Bu konuda olumlu örnekler de bulunmaktadır. Finans ve sağlık sektöründen iki örnek verebiliriz. Örneğin, bir finans kuruluşu, müşteri verilerindeki hataları tespit etmek için yapay zeka tabanlı bir sistem kullanarak yüzde 90 oranında veri doğruluğu sağlamıştır. Bir diğer örnek olarak, bir sağlık şirketi, yapay zeka destekli bir veri kalitesi kontrolü kullanarak, veri kirliliğini azaltarak, daha iyi hasta bakımı sağlamış ve verimliliği artırmıştır.

Verinizin kalitesinden emin olmak için kural tabanlı çözümler kullanmaya karar verdiyseniz bazı dezavantajlar yaşamanız mümkün. Veri kalitesi kontrolü için yapay zeka destekli otomatik bir veri kalitesi ürününün, kural tabanlı çözümlere göre birçok avantajı vardır:

 1. Büyük veri kümelerini hızlı bir şekilde analiz edebilir: Verilerin çokluğu, çeşitliliği ve hızı, insanların veri kalitesini kontrol etmesini zorlaştırabilir. Yapay zeka destekli otomatik veri kalitesi ürünleri, bu büyük veri kümelerini hızlı bir şekilde analiz ederek, hataları tespit edebilir ve zaman kaybını önleyebilir.
 2. Daha doğru sonuçlar verir: Yapay zeka destekli otomatik veri kalitesi ürünleri, kural tabanlı çözümlere göre daha doğru sonuçlar verir. Bu, verileri elle kontrol etmenin yerini alarak, daha doğru ve kapsamlı bir analiz sağlar.
 3. Ölçeklenebilir: Yapay zeka destekli otomatik veri kalitesi ürünleri, verilerin boyutu ne olursa olsun ölçeklenebilir. Bu, işletmelerin verilerini büyüttükçe, veri kalitesi kontrolünü de sürdürmelerine yardımcı olur.
 4. Kendini öğrenen algoritmaları kullanır: Yapay zeka destekli otomatik veri kalitesi ürünleri, kendini öğrenen algoritmalar kullanarak, zamanla daha iyi hale gelir. Bu, işletmelerin zaman içinde daha iyi sonuçlar almasını sağlar.
 5. İnsan hatasını önler: Yapay zeka destekli otomatik veri kalitesi ürünleri, insan hatasını önleyerek, daha kesin sonuçlar sağlar. Bu, işletmelerin veri kalitesi kontrolü konusunda daha güvenli hissetmelerine yardımcı olur.

Peki yapay zeka destekli bir üründen beklentileriniz ne olmalı? Bunları şu şekilde özetleyebiliriz:

 • Veri kalitesine dair metrikler ve veri kalitesinin metrikler bazında gözlemlenmesini sağlamalı.
 • Verideki bozulmaları ve tutarsızlıkları yapay zeka teknolojileri yardımıyla kendi kendine öğrenen ve öğrenmesini sürdüren bir sistem olmalı.
 • Verideki beklenmeyen durumları bulmalı ve “neden ve nasıl” ını açıklamalı.
 • Verinin büyüklükleri dikkate alınınca hızlı olmalıdır. Gerçek zamanlı veya gerçek zamana yakın çalışabilmeli.
 • Bulut ve hibrit ortamlardaki veri varlıklarınızda kullanımı kolay olmalıdır.
 • Otomasyon sağlamalıdır. Kontrolleri düzenli yapabilir olmalı.
 • Verinin kalitesini kontrol eder, “neden ve nasıl” açıklamalarını yaparken, bunları görselleştirmeli, raporlamalı ve gerekli uyarı ve ilgili kişilere mesaj gönderebilmeli.
 • Açık kaynak kodlu teknolojiler kullanılarak geliştirilmiş bir ürünü tercih etmeniz; yeni özelliklerin kolayca eklemesinin, özelleştirmesinin ve uyarlanabilirliğinin esnekliğine sahip olmanızı kolaylaştıracaktır.

Devrim Pamir

Organon Analytics CEO’su