VISUALIZATION OF MULTIDIMENSIONAL DATA IN PURPOSE OF QUALITATIVE CLASSIFICATION OF VARIOUS TYPES OF COAL / WIZUALIZACJA WIELOWYMIAROWYCH DANYCH W CELU KLASYFIKACJI JAKOŚCIOWEJ RÓŻNYCH TYPÓW WĘGLA

Open access

Abstract

Coal as energetic raw material features by many parameters determining its quality. In classification of coal types there are many of them with typical division of energetic, semi-coking and coking coal. The data concerning coal are usually treated as independent values while this kind of approach is not always right. Authors proposed new solutions in this aspect and performed the multidimensional analysis of three selected types of coal featuring by various properties which originated from three various hard coal mines located in Upper Silesia Region. The object of the research was so-called raw coal which was not processed before. For each type of coal the detailed statistical analysis of seven chosen properties of coal was performed. To perform adequate and complete statistical analysis it is necessary to analyze the chosen properties of coal together in multidimensional way. It was decided to apply new and modern visualizing methods of multidimensional data which were observational tunnels method and parallel coordinates method. The applied methods allowed to obtain visualization of seven-dimensional data describing coal. By means of these visualizations it was possible to observe the significant division of the features space between researched types of coal. These methods allowed to look at the investigated data from various perspectives and make possible to determine significant differences between researched materials. For the investigated coals such differences were determined clearly what proved that by means of these methods it is possible to successfully identify type of coal as well to analyze in details its individual properties and identify, for example, particle size fraction etc. The obtained results are innovative and are the basis for more detailed researches taking into consideration also other coal properties, including its structure and texture. This methodology can be also applied successfully for other types of raw materials, like ores.

Streszczenie

Surowce mineralne, które podlegają wzbogacaniu w celu ich lepszego wykorzystania mogą być (charakteryzują się) charakteryzowane wieloma wskaźnikami opisującymi ich, interesujące przeróbkarza, cechy. Podstawowymi cechami są wielkość ziaren oraz ich gęstość, które decydują o przebiegu rozdziału zbiorów ziaren (nadaw) i efektach takiego rozdziału. Rozdział prowadzi się z reguły, w celu uzyskania produktów o zróżnicowanych wartościach średnich wybranej cechy, która zwykle charakteryzowana jest zawartością określonego składnika surowca wyznaczoną na drodze analiz chemicznych. Takie podejście do surowca mineralnego prowadzi do potraktowania go jako wielowymiarowego wektora X = [X1, …, Xn]. Zasadniczym problemem jest także wybór jednostki populacji generalnej (ziarno, jednostka objętości lub masy), co może decydować o kierunkach charakteryzowania wielowymiarowych powiązań cech wektora X. Takimi kierunkami charakteryzowania mogą być: - wielowymiarowe rozkłady wektora losowego X wraz ze wszystkimi konsekwencjami metody (Lyman, 1993; Niedoba, 2009; 2011; Olejnik et al., 2010; Niedoba & Surowiak, 2012); - wielowymiarowe równania regresji wraz z analizą macierzy współczynników korelacji liniowej oraz korelacji cząstkowej (Niedoba, 2013); - analiza czynnikowa (Tumidajski & Saramak, 2009); - inne metody, w tym wizualizacja metodą tuneli obserwacyjnych (Jamróz, 2001), osi równoległych oraz wizualizacja zależności pomiędzy wielowymiarowymi bryłami (Jamróz, 2009). Wielowymiarowe rozkłady wektora X traktowanego jako wektor losowy, mają już swoją bogatą literaturę i praktyczne ich zastosowanie i nie będą przedmiotem tej publikacji. Pozostałe metody są ze sobą w pewien sposób powiązane, co skrótowo zostało przedstawione w artykule. Macierze współczynników korelacji liniowej i współczynników korelacji cząstkowej są związane, z reguły, z istniejącymi modelami liniowymi zależności występujących między badanymi zmiennymi wektora X. Współczynniki korelacji liniowej są wyznaczane dla par zmiennych losowych całkowicie niezależnie od pozostałych zmiennych. Cząstkowe współczynniki korelacji liniowej wyznaczane są w oparciu o macierz współczynniki korelacji liniowej z uwzględnieniem roli pozostałych zmiennych w rozważanym równaniu regresji liniowej. W przypadku analizy trzech zmiennych losowych, z których jedna jest traktowana jako zmienna zależna a dwie pozostałe jako niezależne sprowadza się to do wyznaczania współczynników korelacji dla zrzutowanych punktów równolegle do płaszczyzny regresji na ściany układu współrzędnych. Pozwala to wyznaczyć hierarchię (siłę wpływu) zależności zmiennych w rozpatrywanym układzie. Na analizie macierzy współczynników korelacji liniowej oparta jest analiza czynnikowa, która pozwala pogrupować występujące zmienne w tzw. czynniki, które reprezentują połączone wpływy zmiennych na rezultaty rozpatrywanych procesów, czyli przeprowadzić pewną klasyfikację zmiennych. W klasyfikacji typów węgli wyróżnia się wiele typów, z umownym podziałem na węgle energetyczne i koksujące. Dane dotyczące węgla są traktowane zwykle jako niezależne wielkości, przy czym takie podejście nie zawsze jest właściwe. Autorzy zaproponowali nowe rozwiązania w tym zakresie i dokonali wielowymiarowej analizy trzech wybranych typów węgla o różnych właściwościach (węgle typu 31, 34.2 oraz 35), które pochodziły z trzech różnych kopalń zlokalizowanych w Górnośląskim Okręgu Przemysłowym. Obiektem badań w każdej z tych kopalń był tzw. węgiel surowy, nie poddawany procesom przeróbczym. Dla każdego z węgli dokonano szczegółowej analizy wybranych siedmiu cech, opisujących jego właściwości, których przykładowe wyniki zostały zaprezentowane w tabelach 1-3. Aby dokonać adekwatnej i dokładnej analizy statystycznej zebranych danych konieczna jest wielowymiarowa analiza wybranych cech węgla łącznie. Zdecydowano się na zastosowanie nowatorskich metod wizualizacji wielowymiarowych danych, którymi były metoda tuneli obserwacyjnych oraz metoda osi równoległych. Zasady i metodyka badań zostały przedstawione w podrozdziałach 2 i 3. Zastosowane metody umożliwiły uzyskanie wizualizacji siedmiowymiarowych danych opisujących węgiel. Za pomocą tych wizualizacji możliwe jest zaobserwowanie wyraźnego podziału przestrzeni cech pomiędzy badanymi typami węgla. Metody te umożliwiły spojrzenie na badane dane z różnych perspektyw, które pozwalają na stwierdzenie zasadniczych różnic badanych materiałów. Dla badanych węgli stwierdzono wyraźne takie różnice co świadczy o tym, że za pomocą proponowanych metod możliwa jest skuteczna identyfikacja typu węgla, jak również dokładniejsza analiza jego poszczególnych cech i identyfikacja np. klasy ziarnowej. Szczegółowe obrazy i ich interpretacja zostały przedstawione w rozdziale 3 i we wnioskach końcowych. Rysunki 3-5 obrazują różnice pomiędzy poszczególnymi typami węgla otrzymane metodą tuneli obserwacyjnych. Wyraźnie można rozgraniczyć próbki dotyczące poszczególnych węgli a tym samym możliwa jest identyfikacja typu węgla na podstawie wielowymiarowej analizy. Rysunki 6-7 pokazują zastosowanie innej metody wielowymiarowej, którą była metoda osi równoległych. Metoda ta okazała się być skuteczna do uzyskania informacji o konieczności przeskalowania poszczególnych cech, w celu uzyskania bardziejczytelnych rezultatów. Natomiast rysunek 10 pokazuje różnice otrzymane metodą tuneli obserwacyjnych pomiędzy charakterystykami konkretnych klas ziarnowych wybranego materiału, którym w tym przypadku był węgiel typu 31. Uzyskane wyniki i zastosowana metodyka są nowatorskie i stanowią bazę pod bardziej szczegółowe badania, biorące pod uwagę także inne charakterystyki węgli, w tym ich strukturę i teksturę. Za pomocą przedstawionych metod możliwe jest stwierdzenie, czy wybrane cechy są wystarczające do identyfikacji zarówno typu węgla, jak również klasy ziarnowej i innych jego cech. Metodyka ta może być również stosowana z powodzeniem dla innych typów surowców mineralnych, np. dla rud.

References
  • Aldrich C., 1998. Visualization of transformed multivariate data sets with autoassociative neural networks. Pattern Recognition Letters, vol. 19, issue: 8, p. 749-764, June.

  • Asimov D., 1985. The Grand Tour: A Tool for Viewing Multidimensional Data. SIAM Journal of Scientific and Statistical Computing, vol. 6, no. 1, p. 128-143.

  • Assa J., Cohen-Or D., Milo T., 1997. Displaying data in multidimensional relevance space with 2D visualization maps. Proceedings. Visualization ‘97, p. 127-134. New York, NY, IEEE.

  • Assa J., Cohen-Or D., Milo T., 1999. RMAP: a system for visualizing data in multidimensional relevance space. Visual Computer, vol. 15, no. 5, p. 217-234.

  • Becker R.A., Cleveland W.S., Wilks A.R., 1987. Dynamic graphics for data analysis. Statistical Science 2, p. 355-395.

  • Brożek M., Surowiak A., 2010. Argument of separation at upgrading in the JIG. Arch. Min. Sci., Vol. 55, iss. 1, p. 39-40.

  • Buja A., Asimov D., 1985. Grand Tour Methods: An Outline. Computing Science and Statistics, vol. 17, p. 63-67.

  • Chatterjee A., Das P.P., Bhattacharya S., 1993. Visualization in linear programming using parallel coordinates. Pattern Recognition 26(11), p.1725-1736.

  • Chou S.Y., Lin S.W., Yeh C.S., 1999. Cluster identification with parallel coordinates. Pattern Recognition Letters 20, p. 565-572.

  • Cleveland W.S., McGill R., 1984. The many faces of a scatterplot. Journal of the American Statistical Association 79, p. 807-822.

  • Cook D., Buja A., Cabrera J., Hurley C., 1995. Grand Tour and Projection Pursuit. Journal of Computational and Graphical Statistics, vol. 4, no. 3 p. 155-172.

  • Eick S.G., Wills G.J., 1995. High interaction graphics. European Journal of Operational Research, vol. 81, issue: 3, p. 445-459, March 16.

  • Gennings C., Dawson K.S., Carter W.H., Jr. Myers R.H., 1990. Interpreting plots of a multidimensional dose-response surface in a parallel coordinate system. Biometrics 46, p. 719-735.

  • Hartigan J.A., Kleiner B., 1981. Mosaic for Contingency Tables. In: Computer Science and Statistics: Proceedings of the 13th Symposium on the Interface, p. 268-273, New York: Springer Verlag.

  • Heike H., 2000. Exploring categorical data: interactive mosaic plots. Metrika 51, p. 11-26.

  • Hurley C., Buja A., 1990. Analyzing high-dimensional data with motion graphics. SIAM Journal on Scientific & Statistical Computing, vol. 11, no. 6, p. 1193-1211, Nov.

  • Inselberg A., Dimsdale B., 1994. Multidimensional lines I: representation. SIAM J. Appl. Math. 54 (2), p. 559-577.

  • Inselberg A., 1985. The plane with parallel coordinates, Visual Computer 1, p. 69-91

  • Jain A.K., Mao J., 1992. Artificial neural network for non-linear projection of multivariate data. In: Proc. IEEE Internat. Joint Conf. On Neural Networks, Baltimore, MD, 3, p. 335-340.

  • Jamróz D., 2009. Multidimensional labyrinth - multidimensional virtual reality. In: K. Cyran, S. Kozielski, J. Peters, Stanczyk U., Wakulicz-Deja A. (eds.) Man-Machine, Interactions, AISC, vol. 59, p. 445-450. Springer-Verlag, Berlin Heidelberg, Germany.

  • Jamróz D., 2001. Visualization of objects in multidimensional spaces. Ph.D. Thesis, AGH, University of Science and Technology, Cracow, Poland.

  • Kim S., Kwon S., Cook D., 2000. Interactive visualization of hierarchical clusters using MDS and MST. Metrika 51, p. 39-51, Springer-Verlag.

  • Kraaijveld M., Mao J., Jain A.K., 1995. A nonlinear projection method based on Kohonen’s topology preserving maps. IEEE Trans. Neural Networks 6(3), p. 548-559.

  • Li W., Yue H.H., Valle-Cervantes S., Qin S.J., 2000. Recursive PCA for adaptive process monitoring. Journal of Process Control, vol. 10, issue: 5, p. 471-486, October.

  • Lyman G.J., 1993. Application of Line-Length Related Interpolation Methods to Problems in Coal Preparation - III: Two dimensional Washability Data Interpolation. Coal Preparation, vol. 13, p. 179-195.

  • Mao J., Jain A.K., 1995. Artificial neural networks for feature extraction and multivariate data projection. IEEE Trans. Neural Networks 6(2), p. 296-317.

  • Niedoba T., 2013. Statistical analysis of the relationship between particle size and particle density of raw coal. Physicochemical Problems of Mineral Processing, vol. 49, iss. 1, p. 175-188.

  • Niedoba T., Surowiak A., 2012. Type of coal and multidimensional description of its composition with density and ash contents taken into consideration. in Proceedings of the XXVI International Mineral Processing Congress, vol. 1, p. 3844-3854.

  • Niedoba T., 2011. Three-dimensional distribution of grained materials characteristics. in Proceedings of the XIV Balkan Mineral Processing Congress, Tuzla, Bosnia and Herzegovina, vol. 1, p. 57-59.

  • Niedoba T., 2009. Wielowymiarowe rozkłady charakterystyk materiałów uziarnionych przy zastosowaniu nieparametrycznych aproksymacji funkcji gęstości rozkładów brzegowych. Górnictwo i Geoinżynieria, iss. 4, p. 235-244.

  • Olejnik T., Surowiak A., Gawenda T., Niedoba T., Tumidajski T., 2010. Wielowymiarowe charakterystyki węgli jako podstawa do oceny i korekty technologii ich wzbogacania. Górnictwo i Geoinżynieria, vol. 34, iss. 4/1, p. 207-216.

  • Sobol M.G., Klein G., 1989. New graphics as computerized displays for human information processing. IEEE Trans. Systems Man Cybernet. 19(4), p. 893-898.

  • Stanisz A., 2007. Przystępny kurs statystyki w oparciu o program Statistica PL na przykładach z medycyny, tom III: Analizy wielowymiarowe. Wyd. Statsoft, Kraków.

  • Tumidajski T., Saramak D., 2009. Metody i modele statystyki matematycznej w przeróbce surowców mineralnych. Wydawnictwo AGH, Kraków.

  • Wegman E.J., 1990. Hyper-dimensional data analysis using parallel coordinates. J. Amer. Statist. Assoc. 85 (411), p. 664-675.

Archives of Mining Sciences

The Journal of Committee of Mining of Polish Academy of Sciences

Journal Information


IMPACT FACTOR 2016: 0.550
5-year IMPACT FACTOR: 0.610

CiteScore 2016: 0.72

SCImago Journal Rank (SJR) 2016: 0.320
Source Normalized Impact per Paper (SNIP) 2016: 0.950

Metrics

All Time Past Year Past 30 Days
Abstract Views 0 0 0
Full Text Views 7 7 7
PDF Downloads 2 2 2