Büyük veri, geleneksel veri işleme uygulama yazılımı tarafından ele alınamayacak kadar büyük veya karmaşık olan veri kümelerini analiz etme, sistematik olarak çıkarma veya başka şekilde ele alma yollarını ele alan bir alandır. Birçok vakaya (sıraya) sahip veriler daha fazla istatistiksel güç sunarken, daha yüksek karmaşıklığa (daha fazla özellik veya sütun) sahip veriler daha yüksek bir yanlış bulma oranına yol açabilir.

Büyük veri zorlukları arasında veri yakalama, veri depolama, veri analizi, arama, paylaşma, aktarma, görselleştirme, sorgulama, güncelleme, bilgi gizliliği ve veri kaynağı sayılabilir. Büyük veriler başlangıçta üç temel kavramla ilişkiliydi: hacim, çeşitlilik ve hız. Büyük verileri işlediğimizde, örneklemeyebilir, sadece ne olduğunu gözlemleyebilir ve izleyebiliriz. Bu nedenle, büyük veriler genellikle geleneksel yazılımın kabul edilebilir bir zaman ve değer dahilinde işleme kapasitesini aşan boyutları olan verileri içerir.
Büyük veri teriminin şu anki kullanımı, öngörücü analitik, kullanıcı davranışı analitiği veya verilerden değer elde eden ve nadiren belirli bir veri kümesine erişen bazı diğer gelişmiş veri analizi yöntemlerini kullanma eğilimindedir. “Şu anda mevcut olan veri miktarlarının gerçekten büyük olduğundan şüphe yok, ancak bu yeni veri ekosisteminin en öne çıkan özelliği değil.”
Veri kümelerinin analizi, “iş eğilimlerini tespit etmek, hastalıkları önlemek, suçla mücadele etmek vb.” ile yeni korelasyonlar bulabilir. Bilim adamları, şirket yöneticileri, tıp uygulayıcıları, reklamcılık sektörü ve hükümetler, alanlardaki büyük veri setleri ile ilgili zorlukları düzenli olarak karşılarlar. İnternet aramaları, fintech, kentsel bilişim ve işletme bilişimi dahil.
Veri setleri hızla büyür, çünkü mobil cihazlar, hava (uzaktan algılama), yazılım günlükleri, kameralar, mikrofonlar, radyo frekansı tanımlama (RFID) okuyucular ve kablosuz sensör ağları gibi cihazlar tarafından giderek daha fazla toplanırlar.. Dünyanın bilgi depolamak için teknolojik kişi başına kapasitesi 1980’lerden bu yana her 40 ayda bir iki katına çıkmıştır; 2012 itibariyle her gün 2.5 exabyte veri üretilmektedir. IDC rapor tahminine dayanarak, küresel veri hacmi 2013-2020 arasında 4.4 zettabayttan 44 zettabayta kadar katlanarak büyüyecektir. 2025 yılına kadar IDC 163 zettabayt veri olacağını öngörmektedir.

İlişkisel veritabanı yönetim sistemleri, masaüstü istatistikleri ve verileri görselleştirmek için kullanılan yazılım paketleri genellikle büyük verileri ele almakta zorlanır. Bu çalışma “onlarca, yüzlerce hatta binlerce sunucuda çalışan büyük ölçüde paralel yazılımlar” gerektirebilir. “Büyük veri” olarak nitelendirilen, kullanıcıların ve araçlarının yeteneklerine bağlı olarak değişir ve genişleme yetenekleri büyük verileri hareketli bir hedef haline getirir. “Bazı kuruluşlar için, yüzlerce gigabayt veriyle ilk kez karşılaşılması veri yönetimi seçeneklerini yeniden gözden geçirme ihtiyacını tetikleyebilir.
Büyük Verileri Örnekleme
Büyük veri kümeleri hakkında sorulabilecek önemli bir araştırma sorusu, verilerin özellikleri hakkında belirli sonuçlar çıkarmak için tüm verilere bakmanız gerekip gerekmediği veya yeterince iyi bir örnek olup olmadığıdır. Büyük verinin adı boyutla ilgili bir terim içerir ve bu büyük verinin önemli bir özelliğidir. Ancak Örnekleme (istatistikler), tüm popülasyonun özelliklerini tahmin etmek için daha geniş veri kümesinden doğru veri noktalarının seçilmesini sağlar. Örneğin, her gün yaklaşık milyonlarca tweet üretiliyor. Gün boyunca tartışılan konuları belirlemek için hepsine bakmak gerekli mi? Her bir konu hakkındaki düşünceyi belirlemek için tüm tweet’lere bakmak gerekli midir?
Büyük Veri, demografik, psikografik, davranışsal ve işlemsel veriler gibi çeşitli veri noktası kategorilerine göre ayrılabilir. Büyük veri noktaları kümeleriyle pazarlamacılar, daha stratejik hedefleme için daha özelleştirilmiş tüketici segmentleri oluşturabilir ve kullanabilirler.
Büyük Veri ve Etik
Sadece veri etiği olarak da bilinen büyük veri etiği, verilerle, özellikle kişisel verilerle ilgili doğru ve yanlış davranış kavramlarının sistemleştirilmesi, savunulması ve önerilmesi anlamına gelir. İnternetin başlangıcından bu yana, veri miktarı ve kalitesi önemli ölçüde arttı ve bunu katlanarak devam ediyor. Büyük veriler, geleneksel veri işleme uygulama yazılımının onlarla başa çıkmak için yetersiz olduğu kadar hacimli ve karmaşık olan bu büyük miktarda veriyi tanımlar. Veri Etiği, etkinin ölçeği nedeniyle veri miktarı arttıkça artan önem taşımaktadır.
Büyük veri etiği bilgi etiğinden farklıdır, çünkü bilgi etiğinin odağı daha çok fikri mülkiyet ve kütüphaneciler, arşivciler ve bilgi uzmanları ile ilgili kaygılarla ilgilenirken, büyük veri etiği daha çok yapılandırılmış veya yapılandırılmamış verilerin toplayıcıları ve dağıtıcıları ile ilgilidir. veri brokerleri, hükümetler ve büyük şirketler gibi.
Veri etiği aşağıdaki ilkelerle ilgilidir:
Mülkiyet
Bireyler kendi verilerine sahiptir. Verilerin sahibi kimdir? Mülkiyet, mülkiyet üzerindeki hakların ve görevlerin belirlenmesini içerir. Veri sahipliği kavramı, kişinin kendi verilerini kontrol etme ve kendi verilerini paylaşmayı sınırlama yeteneğiyle bağlantılıdır. Bir kişi gözlemlerini bu gözlemlere sahip olan başka bir kişiye kaydederse? Gözlemci mi yoksa gözlemlenen mi? Gözlemci ve gözlemlenenin birbirleri ile ilgili sorumlulukları nelerdir? İnternetin bir sonucu olarak insanların ve düşüncelerinin gözlemlenmesinin kitlesel ölçeği ve sistematizasyonu nedeniyle, bu soruların ele alınması giderek önem kazanmaktadır. Bir kişinin mülkiyeti olan kölelik, tanınan tüm ülkelerde yasaklanmıştır. Kişisel veri sahipliği sorunu, kurumsal sahiplik, fikri mülkiyet ve kölelik arasında bilinmeyen bir alana girer. Dijital kimliğin sahibi kimdir?
Avrupa yasaları, Genel Veri Koruma Yönetmeliği, bireylerin kendi kişisel verilerine sahip olduklarını göstermektedir.
Kişisel veriler, fiziksel niteliklerden tercihlerine ve davranışlarına kadar değişen bir kişiyi tanımlayan veri kümelerini ifade eder. Kişisel verilere örnekler: Genom verileri, GPS konumu, yazılı iletişim, sözlü iletişim, rehber listeleri, internet tarama alışkanlıkları, finansal işlemler, süpermarket harcamaları, vergi ödemeleri, sabıka kaydı, dizüstü bilgisayar ve cep telefonu kamera lens kaydı, cihaz mikrofon kayıtları, araba takipçileri, mobil ve sağlık kayıtları, fitness aktivitesi, beslenme, madde kullanımı, kalp atışı, uyku düzenleri ve diğer hayati belirtiler aracılığıyla sürüş alışkanlıkları.
İşlem Şeffaflığı
Bireylerin kişisel verileri kullanılıyorsa, toplu veri kümeleri oluşturmak için kullanılan algoritma tasarımına şeffaf erişime sahip olmaları gerekir.
Kişisel verilerle ilgili olarak, bireyin şunları bilme hakkı vardır:
Veriler neden toplanıyor?
Nasıl Kullanılacak?
Ne kadar süre depolanacak?
İlgili kişi tarafından nasıl değiştirilebilir?
Veri işleminin etik kullanım örnekleri şunlardır:
Yasal amaçlar: Kişisel verilerin devlet tarafından toplanması ve kullanılması tamamen şeffaf olmalı ve herhangi bir veri toplamadan önce müzakere edilen resmi bir lisans kapsamında olmalıdır. Birey ve sorumlu makamlar arasındaki bu medeni sözleşme, bireyin verilerinin kullanımını yukarıdaki şeffaflık ilkelerine uygun olarak sorumlu makamlara lisansladığı koşulları belirler.
Sosyal amaçlar: Bireysel verilerin sosyal amaçlar için tüm kullanımları otomatik olarak kapsam dışında kalmalı. Şeffaflık ilkelerine uymalıdırlar.
Suç: Suçun önlenmesi için, kişisel verilerin toplanması ve kullanılması için açık bir dizi genel ilke oluşturulmalı ve yaygın bir şekilde duyurulmalıdır. Devletin yönetim organı bu ilkeleri dikkate almalı ve onaylamalıdır.
Ticaret: Ticari amaçlar için kullanılan kişisel veriler kişiye aittir ve izin verilen tüm kullanımları belirleyen bir kişinin lisansı olmadan kullanılamaz. Bu, tüm web sitelerinden toplanan verileri, sayfa ziyaretlerini, siteden siteye aktarımları ve diğer İnternet etkinliklerini içerir. Kişiler, kişisel verilerinin ticari amaçlarla, duruma göre veya kategoriye göre nasıl ve nerede ve kullanılacağına karar verme hakkına sahiptir.
Araştırma: araştırma amacıyla kullanılan kişisel veriler bireye aittir ve yukarıda belirtilen tüm şeffaflık ilkelerini karşılayan kişisel onay formu uyarınca kullanıcıdan lisanslanmalıdır.
Yasal olmayan amaçlar: Kişisel veriler yalnızca hak sahibinin açık onayı ile ekstra yasal amaçlar için kullanılabilir.
Onay
Bireysel veya tüzel kişi kişisel verileri kullanmak istiyorsa, kişisel verilerin kime, ne zaman ve hangi amaçla verinin sahibinden taşındığı konusunda bilgili ve açık bir şekilde ifade edilmiş rızasına ihtiyaç duyulur.
Bir birey veya tüzel kişi kişisel verileri kullanmak istiyorsa, verilerin kişisel verilerinden kime, ne zaman ve hangi amaçla verinin taşındığına dair bilgili ve açık bir şekilde onaylanması gerekir. Bilgilerin sahibi, verilerinin nasıl kullanıldığını öğrenme hakkına sahiptir.
Veri işlemi, ilgisiz veya gereksiz bir onay meselesi için bir pazarlık aracı olarak kullanılamaz. Veri paylaşımının gerekli olduğu hizmetler olsa da, bu işlemler abartılmamalı ve bağlam içinde tutulmalıdır. Örneğin, bireyin yeterli tıbbi tavsiye almak için verileri paylaşması gerekir, ancak tıbbi verilerin otomatik olarak bir sağlık sigortası sağlayıcısına gitmesi gerekmez.
Gizlilik
Veri işlemleri gerçekleşirse, gizliliği korumak için tüm makul çaba gösterilmelidir.
“Hiç kimse mahremiyeti, ailesi, evi veya yazışmaları ile keyfi olarak müdahale edemez, onuruna ve itibarı üzerine saldırılara maruz bırakılamaz. Herkesin bu tür müdahalelere veya saldırılara karşı yasal koruma hakkı vardır.” – Birleşmiş Milletler İnsan Hakları Beyanı Madde 12.
Gizlilik neden önemlidir? Veriler, sistemleri daha verimli hale getirmek için yararlıdır; bununla birlikte, bu verimliliğin nihai hedefinin tanımlanması etik veri kullanımının nasıl değerlendirildiğinin belirlenmesinde önemlidir.
Parasal Değer
Bireyler, kişisel verilerinin kullanımından ve bu işlemlerin ölçeğinden kaynaklanan finansal işlemlerin farkında olmalıdır.
Veriler değerlidir, çünkü kullanıcıların deneme yanılma yöntemiyle tahmin ettikleri veya çalıştıklarından daha verimli hareket etmelerine olanak tanır. Verilerin değeri olan iki unsur vardır: eğilimleri göstermesi ve gerçek zamanlı olması. Geçmiş verilerinin oluşturulması, eğilimlere dayalı geleceğe yönelik tahminlerde bulunmamızı sağlar. Gerçek zamanlı veriler değerlidir çünkü eylemler anında yapılabilir.
Arama motoru, iletişim kanalı ve dijital harita gibi teknik servislerin değeri nedir? Teknoloji şirketlerinin sağladığı hizmetler ile bu teknoloji şirketlerinin özkaynak değeri arasındaki değer farkı, kişilerin sunduğu verilerin değerinin “piyasa oranı” arasındaki farktır.
Açıklık
Toplam veri kümeleri serbestçe kullanılabilir olmalıdır.
Açık veri fikri, verilerin serbestçe erişilebilir olması ve telif hakkı yasaları gibi kullanımını yasaklayacak kısıtlamalara sahip olmaması gerektiği argümanı etrafında toplanmaktadır. 2014 itibariyle, birçok hükümet şeffaflık ve hesap verebilirlik amacıyla açık veri setleri yayınlamaya başlamıştır.
Bu hareket, hükümetlerin vatandaşların verilerden anlam çıkarmasına ve kendilerini kontrol ve dengeleme yapmalarına izin vermek için veri kümelerini hazır hale getirmelerini isteyen “açık veri aktivistleri” aracılığıyla sağlanmıştır.
Turizmde Büyük Veri
Turizm endüstrisi bilgi ile gelişir. Büyük veriler, turizm endüstrisini geliştiren davranış ve insan faaliyetleri ile ilgili güncel ve son derece bilinçli çıkarımlar sağlayabilir. Turistler, web üzerinde mobil teknolojileri kullanırken çeşitli dijital izler bırakıyor. Her turist aracılığıyla, yolculuğun öncesinde, arasında ve sonrasında farklı seyahat aşamalarıyla ilgili her şey hakkında muazzam miktarda veri mevcuttur. Çoğu bilgi, sosyal ağ beslemeleri gibi harici bir niteliktedir veya Twitter biçimindedir.
Buluttaki büyük miktarda veri kullanılabilirliği nedeniyle, analitik, verilerde mevcut olan bilgileri anlamlandırma ihtiyacı haline gelmiştir. Bir seyahat planlayan yeni bir müşteriyseniz, bilet satın alırken, turistik yerleri araştırırken veya konaklama rezerve ederken muhtemelen internetten daha fazla kaynak edinirsiniz. Turizm endüstrisi üyeleri, fırsatları, karar verme ve genel performansı iyileştirmek için yeni yollar bulmak için yavaşça büyük verilere yöneliyorlar, örneğin, dağınık bilgilerin birbirine bağlanması büyük verilerle mümkün hale getirilebilir.
1. Gelir Yönetimi
Seyahat endüstrisindeki büyük verilerin en etkili kullanımlarından biri gelir yönetimiyle bağlantılıdır. Finansal sonuçları en üst düzeye çıkarmak için, oteller ve diğer turizm şirketlerinin doğru ürünü, doğru müşteriye, doğru zamanda, doğru fiyata, doğru kanal üzerinden satabilmesi gerekir ve bunun için büyük veriler paha biçilmez olabilir.
Özellikle, geçmiş doluluk oranları, oda geliri ve mevcut rezervasyonlar gibi dahili veriler, talebi daha doğru bir şekilde tahmin etmek ve tahmin etmek için yerel etkinlikler, uçuşlar ve okul tatilleri gibi bilgilerle birleştirilebilir. Bunun sonucunda oteller, üretilen geliri en üst düzeye çıkarmak için fiyatları ve oda fiyatlarını daha iyi yöneterek yüksek talep zamanlarında artırabilirler.
2. İtibar Yönetimi
Turizm endüstrisindeki büyük veriler için bir diğer önemli kullanım, itibar yönetimi ile bağlantılıdır. İnternet çağında, müşteriler, sosyal medya siteleri, arama motorları ve özel inceleme web siteleri de dahil olmak üzere, görüşlerini ve deneyimlerini paylaşan çok çeşitli platformlarda yorum bırakabilirler. Ayrıca, müşteriler bu incelemeleri giderek daha fazla kontrol ediyor ve rezervasyon yapmadan önce farklı otelleri karşılaştırıyor.
Bu veriler, dahili olarak alınan geri bildirimlerle birleştirildiğinde, en önemli güçlü ve zayıf yönleri ve müşterilerin etkilendiği veya hayal kırıklığına uğradığı yerleri tespit etmek için kullanılabilir. Bu bilgiler toplandıktan sonra oteller, iyileştirmeler yapmak ve gelecekteki incelemelerin olumlu olmasını sağlamak için eğitim çabalarını bilgilendirmek için kullanabilir.
3. Stratejik Pazarlama
Seyahat endüstrisinde pazarlamanın doğru olması zor olabilir, çünkü potansiyel müşteriler kim olduklarından, nereden geldikleri ve ne aradıkları konusunda çok çeşitlidir. Bununla birlikte, büyük veriler turizm şirketlerinin pazarlama çabalarına daha stratejik bir yaklaşım benimsemelerine ve doğru insanları doğru şekilde hedeflemelerine yardımcı olabilir.
Daha spesifik olarak, büyük veriler işletmelerin müşterileri arasında var olan ana eğilimleri, benzerliklerin nerede olduğunu ve en iyi pazarlama fırsatlarının neler olduğunu belirlemelerine yardımcı olabilir. Ayrıca, işletmelerin bu insanların nerede olduğunu ve pazarlamanın kendileri için en alakalı ne zaman olduğunu anlamalarına yardımcı olabilir. Bu, pazarlama mesajlarının zaman, konum ve diğer verilere dayanarak gönderilmesine olanak vererek daha hedefli tanıtım içeriğinin sunulmasına olanak tanır.
4. Müşteri Deneyimi
Seyahat ve turizm endüstrisindeki oteller ve diğer işletmeler, müşterilerle çok çeşitli etkileşimlere sahiptir ve bu etkileşimlerin her biri, genel müşteri deneyimini iyileştirmek için kullanılabilecek değerli veriler sağlayabilir. Bu veriler, sosyal medya konuşmalarından ve çevrimiçi incelemelerden hizmet kullanım verilerine kadar her şeyi içerebilir.
Etkin bir şekilde kullanıldığında, bu bilgiler müşterilerin en çok hangi hizmetleri kullandıklarını, hangilerinin hiç kullanmadıklarını ve hangilerinin talep edip konuşabileceklerini ortaya çıkarabilir. Bu veriler sayesinde şirketler, halihazırda verdikleri hizmetler, artık sağlamaları gerekmeyen hizmetler, tanıtmak istedikleri hizmetler ve yatırım yapmayı seçtikleri yeni teknoloji hakkında daha bilinçli, veriye dayalı kararlar alabilirler.
5. Pazar Araştırması
Son olarak, seyahat ve turizm endüstrisindeki kişiler, diğer otellerin veya işletmelerin müşterilere neler sunduğunu daha iyi anlamak için ana rakipleri hakkında bilgi derlemek ve analiz etmek için büyük verileri kullanabilirler. Yine, bu veriler çeşitli kaynaklardan elde edilebilir, çünkü müşterilerin oteller ve seyahat şirketleri hakkında, özellikle çevrimiçi olarak görüşlerini paylaşacakları yer sıkıntısı yoktur.
Nihayetinde, veriler rakip şirketlerin güçlü yönlerini, zayıf yönlerini ve genel itibarını belirlemek için kullanılabilir. Bu, iş liderlerinin pazardaki potansiyel boşlukları veya rakiplerin başarısız olduğu şekillerde sunma fırsatlarını tespit etmelerine yardımcı olabileceği için son derece değerli olabilir. Bu da daha fazla talep ve daha yüksek gelir sağlayabilir.
Turizm kurulları ve turizm sektöründeki şirketler bu tür verilerden pek çok şekilde yararlanabilirler. Bu, pazarlama kampanyalarını saptamayı, ziyaretçilerin olası ilgi alanlarına göre hazırlanmış paketler sunmayı ve hangi ülkelerde kazanan müşterilere odaklanacağına karar vermeyi içerir.
Bu bilgiler, karar verme sürecinde büyük bir yardımcı olabilir ve turizm endüstrisinin işleyişini geliştirebilir. Turizm endüstrisindeki oyuncular artık analitik ve sayı güdümlü veriler temelinde bilinçli kararlar alabilirler. Gezi planlama sürecinin her aşamasında hedeflenen potansiyel müşteri gruplarını belirleyebilirler. Ayrıca verimliliği ve hizmet kalitesini artırabilirler. Büyük veriler, pazarlarında hangi yeni ürünlerin iyi çalışabileceğini tahmin etmek için bile kullanılabilir.
Turistler için etkin bir şekilde kullanılan büyük veri teknolojileri, ilgi alanlarına ve ihtiyaçlarına göre kişiselleştirilmiş tekliflere dönüşebilir. Müşterilere ve ihtiyaçlarına odaklanan gelişmiş deneyimler alabilirler. Büyük veriler sadece gelecekteki eğilimleri tahmin etmek için öngörücü bir araç olarak değil, aynı zamanda turistlerin ihtiyaçlarını neredeyse anında tahmin etmek ve yanıtlamak için gerçek zamanlı olarak kullanılabilir.
Kaynakça
Kitchin, Rob (August 18, 2014). The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. SAGE. p. 27. ISBN 9781473908253.
Zwitter, A. (2014). “Big Data Ethics”. Big Data & Society. 1 (2): 4. doi:10.1177/2053951714559253.
Hilbert, Martin; López, Priscila (2011). “The World’s Technological Capacity to Store, Communicate, and Compute Information”. Science. 332 (6025): 60–65. Bibcode:2011Sci…332…60H. doi:10.1126/science.1200970. PMID 21310967. Retrieved 13 April 2016.
Breur, Tom (July 2016). “Statistical Power Analysis and the contemporary “crisis” in social sciences”. Journal of Marketing Analytics. 4 (2–3): 61–65. doi:10.1057/s41270-016-0001-3. ISSN 2050-3318.
boyd, dana; Crawford, Kate (21 September 2011). “Six Provocations for Big Data”. Social Science Research Network: A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society. doi:10.2139/ssrn.1926431.
“Data, data everywhere”. The Economist. 25 February 2010. Retrieved 9 December 2012.
“Community cleverness required”. Nature. 455 (7209): 1. September 2008. Bibcode:2008Natur.455….1.. doi:10.1038/455001a. PMID 18769385.
Reichman OJ, Jones MB, Schildhauer MP (February 2011). “Challenges and opportunities of open data in ecology”. Science. 331 (6018): 703–5. Bibcode:2011Sci…331..703R. doi:10.1126/science.1197962. PMID 21311007.
Hellerstein, Joe (9 November 2008). “Parallel Programming in the Age of Big Data”. Gigaom Blog
Segaran, Toby; Hammerbacher, Jeff (2009). Beautiful Data: The Stories Behind Elegant Data Solutions. O’Reilly Media. p. 257. ISBN 978-0-596-15711-1.
Hilbert M, López P (April 2011). “The world’s technological capacity to store, communicate, and compute information” (PDF). Science. 332 (6025): 60–5. Bibcode:2011Sci…332…60H. doi:10.1126/science.1200970. PMID 21310967.
“IBM What is big data? – Bringing big data to the enterprise”. ibm.com. Retrieved 26 August 2013.
Reinsel, David; Gantz, John; Rydning, John (13 April 2017). “Data Age 2025: The Evolution of Data to Life-Critical” (PDF). seagate.com. Framingham, MA, US: International Data Corporation. Retrieved 2 November 2017.
Oracle and FSN, “Mastering Big Data: CFO Strategies to Transform Insight into Opportunity” Archived 4 August 2013 at the Wayback Machine, December 2012
Jacobs, A. (6 July 2009). “The Pathologies of Big Data”. ACMQueue.
Magoulas, Roger; Lorica, Ben (February 2009). “Introduction to Big Data”. Release 2.0. Sebastopol CA: O’Reilly Media (11).
