UPORABA STROJNEGA UČENJA ZA DOLOČITEV POPLAVLJENIH OBMOČIJ – PRIMER POPLAV V SELŠKI DOLINI LETA 2007
APPLICATION OF DATA MINING FOR DETERMINATION OF FLOODED AREAS – SELŠKA VALLEY 2007 FLOODS CASE STUDY

Peter Lamovec, Krištof Oštir

DOI: 10.15292/geodetski-vestnik.2010.04.661-675

 

Izvleček:

V prispevku je obravnavana uporabnost postopkov strojnega učenja pri ugotavljanju poplavljenih območij v zgornjem delu Selške doline, ki jo je 18. 9. 2007 prizadelo hudourniško deževje. Hitro prepoznavanje poplavljenih območij je ključnega pomena za učinkovito reševanje in povračilo škode od zavarovalnic. Pri tem so zelo uporabni satelitski
posnetki, saj omogočajo hitro določitev poplavljenih območij, tudi če so prizadeti zelo veliki predeli. Za prepoznavanje poplavljenih območij v Selški dolini so bile uporabljene tehnike strojnega učenja z različnimi vhodnimi podatki: satelitski posnetek SPOT (multispektralni in pankromatski), indeks NDVI, relief in njegovi izdelki (nadmorska višina, naklon, ukrivljenost), oddaljenost od vodotokov in raba tal. Učni vzorci, ki so bili uporabljeni za oblikovanje modela klasifikacije, so vsebovali 400, 255 oziroma 49 vzorčnih točk.

Ključne besede: strojno učenje, odločitveno drevo, klasifikacija, satelitski posnetki, poplave

 

Abstract:

This paper discusses the usefulness of machine-learning procedures for determining flooded areas in the upper part of the Selška valley. The area was affected by torrential rains on 18.9.2007. Rapid identification of flooded areas is essential for effective implementation of rescue operations and damage assessments. In this case, satellite images are very useful because they enable quick identification of flooded areas even in very large areas. To determine the flooded areas, machine learning techniques were applied to different input data. SPOT satellite image (multispectral and panchromatic), NDVI index, relief and its derivatives (altitude, slope, curvature), distance from rivers and land use were used. The learning samples consisted of 400, 255 and 49 sample points, which were used to build three different classification models.

Keywords: machine learning, decision trees, classification, satellite images, floods

 

Literatura / References:

ArcGIS (2010). Pridobljeno 22. 11. 2010 s spletne strani: http://www.esri.com/software/arcgis/arcgis10/ index.html.

Džeroski, S. (2001). Data Mining in a Nutshell. V: S. Džeroski in N. Lavrač (ur.), Relational Data Mining. Berlin: Springer, 3–27.

Erdas Imgine (2010). Pridobljeno 22. 11. 2010 s spletne strani: http://www.erdas.com/default.aspx.

Fayyad, U., Piatetsky-Shapiro, G., Smyth, P. (1996). From data minig to knowledge discovery: An overview. V: U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, R. Uthurusamy (ur.), Advances in Knowledge Discovery and Data Mining. Cambridge: MIT Press, 1–34.

Frawley, W., Piatetsky-Shapiro, G., Matheus, C. (1991). Knowledge discovery in databases: An overview. V: G. Piatesky-Shapiro, W. Frawley (ur.), Knowledge discovery in databases. Cambridge: MIT Press, 1–27.

Hrvatin, M., Perko, D. (2002). Ugotavljanje ukrivljenosti površja z digitalnim modelom višin in njena uporabnost v geomorfologiji. V: T. Podobnikar, D. Perko, M. Krevs, Z. Stančič, D. Hladnik (ur.), Geografski informacijski sistemi v Sloveniji 2001-2002. Ljubljana: ZRC-SAZU, 65–72.

Kononenko, I. (1997). Strojno učenje. Ljubljana: Založba FE in FRI.

Maimon, O., in Rokach, L. (2005). Introduction to knowledge discovery in databases. V: O. Maimon in L. Rokach (ur.), Data Mining and Knowledge Discovery Handbook. New York: Springer, 1–17.

Pehani, P., Kokalj, Ž., Marsetič, A., Oštir, K. (2008). Uporaba satelitskih posnetkov za analizo poplav septembra 2007. V: D. Perko, M. Zorn, N. Razpotnik, M. Čeh, D. Hladnik, M. Krevs, T. Podobnikar, B. Repe, R. Šumrada (ur.), Geografski informacijski sistemi v Sloveniji 2007–2008. Ljubljana: Geografski inštitut Antona Melika ZRC-SAZU, 117–128

Polanec, K. Strojno učenje (2006). Pridobljeno 23. 11. 2009 s spletne strani: http://dat.si/publikacije/Article/Strojno-u--269-enje/66.

ARSO (2008). Visoke vode in poplave 18. septembra 2007 (26. 2. 2008). Pridobljeno 20. 11. 2010 s spletne strani:
http://www.arso.gov.si/vode/poro%C4%8Dila%20in%20publikacije/Visoke%20vode%20in%20poplave%2018.%20septembra%202007.pdf.

Vodišek, D. (2009). Opazovanje poplav s podatki daljinskega zaznavanja. Diplomska naloga. Ljubljana: Fakulteta za gradbeništvo in geodezijo.

Weka (2010). Pridobljeno 22. 11.2010 s spletne strani: http://www.cs.waikato.ac.nz/ml/weka/.

Witten, I. H., Frank, E. (2005). Data mining: practical machine learning tools and techniques. Second Edition. Elsevier: San Francisco.