You are here

GÖRSEL VERİ MADENCİLİĞİ TEKNİKLERİNİN KÜMELEME ANALİZLERİNDE KULLANIMI VE UYGULANMASI

USING VISUAL DATA MINING TECHNIQUES IN CLUSTERING ANALYSIS AND AN APPLICATION

Journal Name:

Publication Year:

Abstract (2. Language): 
Cluster analyses play a very important role in data mining process. A critical and important issue is to decide outliers, potential cluster structures, optimal number of clusters, to choose suitable cluster algorithms and to effectively evaluate the cluster results in cluster analysis. Various quantitative methods can overcome the problems. However, using the quantitative methods, some details can be missed that the details would be important. In the article, dealing with visual data mining techniques, with human visual system’ supports, is showed how to effectively decide outliers, potential cluster structures, optimal number of clusters, choose suitable cluster algorithms and evaluate the cluster results in cluster analysis. In this way, more efficient the result of clustering can found in the field of data mining.
Abstract (Original Language): 
Veri madenciliği çalışmalarında kümeleme analizleri önemli bir yer teşkil etmektedir. Kümeleme analizlerinde sapan değerlerin, potansiyel küme yapılarının, uygun küme sayılarının keşfi, uygun kümeleme algoritmalarının seçimi ve küme sonuçlarının değerlendirilmesi kritik bir öneme sahiptir. Çeşitli, sayısal yöntemlerle bu tür sorunların üstesinden gelinebilir. Ancak sayısal yöntemlerle bazı önemli olabilecek ayrıntılar gözden kaçırılabilir. Bu çalışmada görsel veri madenciliği yöntemleri yardımıyla, insan algı sisteminin de devreye girmesiyle etkili bir şekilde, sapan değerlerin, potansiyel küme yapılarının, küme sayılarının keşfedilebileceği, uygun kümeleme algoritmalarının seçilebileceği ve küme sonuçlarının değerlendirilebileceği gösterilmiştir. Bu sayede veri madenciliği alanında daha etkin küme sonuçlarına ulaşılabilinecektir.
83-104

REFERENCES

References: 

[1] Andrews D. F., “Plots Of High-Dimensional Data”, Biometrics, Cilt 28, No 1, 125-136,
1972.
[2] Everitt B. S. and Nicholls P., “Visual Techniques For Representing Multivariate Data”,
The Statistician, Cilt 24, No 1, 37-49, 1975.
[3] Chen K. and Liu L., “IVIBRATE: Interactive Visualization-Based Framework for
Clustering Large Datasets”, ACM Transactions on Information Systems, Cilt 24, No 2,
245-294, 2006.
[4] Xu R. and Wunsch D., “Survey Of Clustering Algorithms”, IEEE Transactions on Neural
Networks, Cilt 16, No 3, 645-678, 2005.
[5] Han J. and Kamber M., “Data Mining: Concepts and Techniques”, 1. Baskı, Morgan
Kaufmann, San Francisco, 2000, 270-296.
[6] Tan P., Steinbach M. and Kumar V., “Introduction To Data Mining”, 1. Baskı, Addison
Wesley, USA., 2006, 487-532, 541-542 and 569-642.
[7] M. Halkidi, Y. Batistakis and M. Vazirgiannis, “Cluster validity methods: part I”,
SIGMOD Record., Cilt 31, No 2, 40-45, 2002.
[8] M. Halkidi, Y. Batistakis and M. Vazirgiannis, “Cluster validity methods: part II”,
SIGMOD Record., Cilt 31, No 3, 19-27, 2002.
[9] Bezdek J. C. and Hathaway R. J., “VAT: A Tool For Visual Assesment Of (Cluster)
Tendency”, Proceedings of the 2002 International Joint Conference on, Honolulu, HI,
USA, May, 2002, 2225-2230.
[10] Bilgin T. T., “Çok Boyutlu Uzayda Görsel Veri Madenciliği İçin Üç Yeni Çatı Tasarımı
ve Uygulamaları”, Doktora Tezi, Fen Bilimleri Enstitüsü, Marmara Üniversitesi, İstanbul,
2007.
[11] Ankerst M., “Visual Data Mining”, Doktora Tezi, Institute for Computer Science,
University of Munchen, 2000.
[12] Keim D. A., “Information Visualization and Visual Data Mining”, IEEE on Transactions
on Visualizations and Computer Graphics, Cilt 8, No 1, 1-8, 2002.
[13] Bartke K., “2D, 3D and Hight-Dimensional Data and Information Visualization”,
University of Hannover, Institut für Wirtschaftsinformatik. Available from:
http://www.iwi.uni-hannover.de/lv/seminar_ss05/bartke/Assets/Paper.pdf |accessed
September 24,2008|.
[14] Martinez W. L. and Martinez A. R., “Exploratory Data Analysis with MATLAB”, 1.
Baskı, Boca Raton: CRC Press, USA., 2005, 321-331 ve 337-343
[15] İnal E., “Verinin Keşfedilmesi”, Gebze İleri teknoloji Enstitüsü, Available from:
http://www.bilmuh.gyte.edu.tr/BIL454/ |accessed September 24,2008|.
[16] Özdamar K., “Paket Programlar İle İstatistiksel Veri Analizi 2”, 5. Baskı, Kaan Kitabevi,
Eskişehir, 2004, 213-230 ve 279-292
[17] Kovacs F., Legany C. and Babos A., “Cluster Validity Measurement Techniques”, 6th
International Symposium of Hungarian Researchers on Computational Intelligence,
Budapest, Hungary, November, 2005
[18] Toledo M. D. G., ”A Comparison In Cluster Validation Techniques ”, Yüksek Lisans
Tezi, Mathematics Department, University Of Puerto Rico, 2005.
[19] Volkovich Z., Barzily Z. and Morozensky L., “A Statistical Model Of Cluster Stability”,
Pattern Recognition, Cilt 41, No 7, 2174-2188, 2008
[20] DİE, “Genel Nüfus Sayımı, İdari Bölünüş”, İstanbul, 2000
[21] Türkiye Bankalar Birliği, “Banka Şubeleri Sorgulama”, Available from:
http://www.tbb.org.tr/net/subeler/, |accessed November 12,2008|.
[22] Devlet İstatistik Enstitüsü, “İlçeler İtibariyle Gayri Safi Yurtiçi Hasıla”, Available from:
http://www.die.gov.tr/TURKISH/SONIST/GSYIH/241097t1.htm, |accessed November
12,2008|.
[23] The MathWorks Inc, Available from: http://www.mathworks.com/, |accessed November
12,2008|.
[24] SPSS Inc, Available from: http://www.spss.com/, |accessed November 12,2008|.
[25] Demsar J., Zupan B. and Leban G., Faculty of Computer and Information Science,
University of Ljubljana, Available from: http://www.ailab.si/orange/, |accessed November
12,2008|.
[26] Saraçlı S., Yılmaz V. ve Kaygısız Z., “Türkiye’ de Beşeri Kalkınmışlığın Coğrafi
Dağılımının Çok Değişkenli İstatistiksel Tekniklerle İncelenmesi”, 3. Ulusal Bilgi,
Ekonomi ve Yönetim Kongresi, Eskişehir, Kasım, 2004, 21-28.
[27] Wang, K.J., Cluster Validation ToolBox CVAP, Available from:
http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId...
|accessed November 12,2008|.
[28] Ding Y. and Harrison R. F., “Relational visual cluster validity (RVCV)”, Pattern
Recognition Letters, Cilt 28, No 15, 2071-2079, 2007.

Thank you for copying data from http://www.arastirmax.com