top of page
Datahub Logo.png

DataHUB

Dijital dünyada Veri her ÅŸeydir. Ä°ÅŸletmeler karar vermek, eÄŸilimleri anlamak ve performansı deÄŸerlendirmek için verilere güvenir. Veriler, iÅŸletmelerin iÅŸleyiÅŸinde giderek daha merkezi hale geldikçe, veri kalitesinin önemi de artıyor. Veri kalitesi, verilerin doÄŸruluÄŸunu, eksiksizliÄŸini, güncelliÄŸini ve tutarlılığını ifade eder. BaÅŸka bir deyiÅŸle, verilerin temiz, doÄŸru ve güncel olduÄŸundan emin olmakla ilgilidir. Veriler güvenilir deÄŸilse, o verilere dayanan herhangi bir içgörü veya karar da güvenilmez olacaktır.

Kötü veri kalitesi, yanlış analizlere ve yanlış karar almaya yol açarak iÅŸ performansını olumsuz etkileyebilir. Bu nedenle veri kalitesi çok önemlidir - saÄŸlam iÅŸ kararları almak için gereklidir. Veri kalitesi, veri yönetiÅŸiminin temel bileÅŸenlerinden biridir. Veri yönetiÅŸimi, yaÅŸam döngüsü boyunca verileri yönetmek için bir çerçevedir. Verilerin alınması, saklanması, kullanılması ve imha edilmesi için süreçleri ve prosedürleri içerir.

Veri kalitesinde aranan temel özellikleri aÅŸağıdaki gibidir;

​

Verinin kullanıcı gereksinimlerini karşılama derecesi olarak tanımlanabilir. ÖrneÄŸin, bir ürünün satışını ölçüyorsanız, verilerin o ürünün ne kadarının satıldığını doÄŸru bir ÅŸekilde yansıtması gerekir. Veri doÄŸruluÄŸunda dikkat edilmesi gereken bazı hususlar;

Accuracy.png

Veri DoÄŸruluÄŸu (Data Accuracy)

Yanlış veri: GerçeÄŸi yansıtmayan veridir. ÖrneÄŸin, harcama verileri farklı bir harcama kategorisi ile yanlış bir ÅŸekilde iliÅŸkilendirilirse hatalı bir analiz yapılmasına neden olur.

​

Yinelenen veri: Veri kümesinde birden fazla görünen kayıtlardır. ÖrneÄŸin, aynı müÅŸteri için iki farklı kayda sahip müÅŸteri kaydınız varsa, bu yinelenen veri olarak kabul edilir.

​

Eksik veri: Veri setinde bulunması gereken ancak olmayan verilerdir.

Güncellik, verilerin mevcut durumu yansıtma derecesi olarak tanımlanabilir. ÖrneÄŸin, satılan ürün sayısını ölçüyorsanız, geçen yılın verileri güncel veriler olarak kabul edilmeyecektir. 

Sandwatch.png

Veri GüncelliÄŸi (Data Timeliness)

Eski veri: GeçmiÅŸ bir zaman dilimini yansıttığı için artık doÄŸru olmayan verilerdir. ÖrneÄŸin, geçen aya ait veriler eski veriler olarak kabul edilir.

Ä°stenen tüm bilgilerin bir veri kümesinde bulunma derecesi olarak tanımlanabilir. Veri bütünlüÄŸünde genellikle bu beÅŸ sorunun cevabı aranır; Kim, ne, ne zaman, nerede ve neden.

Completeness.png

Veri BütünlüÄŸü (Data Copleteness)

Eksik veri: Bilgileri eksik olan verilerdir. ÖrneÄŸin, yalnızca kısmi müÅŸteri verileriniz varsa, bu eksik veri olarak kabul edilir.

​

Alakasız veri: Sorulan soruyla ilgili olmayan verilerdir. ÖrneÄŸin, satılan ürün sayısını ölçüyorsanız, ÅŸirketteki çalışan sayısına iliÅŸkin veriler alakasız veriler olarak kabul edilir.

Veri tutarlılığı, verilerin farklı veri kümelerinde aynı olma derecesi olarak tanımlanabilir. ÖrneÄŸin, iki farklı kaynaktan müÅŸteri verileriniz varsa ve veriler tutarsızsa (ör. bir kaynağın e-posta adresi varken diÄŸerinin yok), bu durumda tutarsız veri olarak kabul edilir.

​

Veri bütünlüÄŸü (Data Integrity)

Veri bütünlüÄŸü, verinin orijinal durumundan deÄŸiÅŸtirilmemiÅŸ olma derecesi olarak tanımlanabilir. ÖrneÄŸin, müÅŸteri verileriniz varsa ve birisi veriyi deÄŸiÅŸtirmiÅŸse (örn. e-posta adresini deÄŸiÅŸtirmiÅŸse), bu bir veri bütünlüÄŸü sorunu olarak deÄŸerlendirilir.

white-puzzle.jpg

Veri Tutarlılığı (Data Consistency)

Farklı veri formatları: Ä°stenen formattan farklı bir ÅŸekilde formatlanan verilerdir. ÖrneÄŸin, bir metin dosyasında müÅŸteri verileriniz varsa ancak bunun bir CSV dosyasında olmasını istiyorsanız, bu veriler farklı bir biçimde kabul edilir.

​

Yapılandırılmış ve yapılandırılmamış veri: Belirli bir ÅŸekilde düzenlenmiÅŸ (örneÄŸin bir tabloda) veya hiç düzenlenmemiÅŸ verilerdir. ÖrneÄŸin, metin verileri yapılandırılmamış veriler olarak kabul edilirken, bir CSV dosyasındaki veriler yapılandırılmış veri olarak kabul edilir.

Örnek Bir
DataHUB Modeli

image.png
bottom of page