[Back]


Talks and Poster Presentations (with Proceedings-Entry):

G. Navratil:
"Modeling Data Quality with Possibility-Distributions";
Talk: 5th International Symposium on Spatial Data Quality (ISSDQ '07), Enschede, the Netherlands; 2007-06-13 - 2007-06-15; in: "Spatial Data Quality 2007", (2007), 12 pages.



English abstract:
Description of data quality relies heavily on numbers. When dealing with data sets, which have been collected during longer periods, however, variation in the data quality will become evident. Older data may have different quality than newer data and other aspects including height or acces-sibility may influence the quality of parts of the data set. Precise numbers do not reflect this varia-tion, thus I propose the use of fuzzy numbers to specify data quality.
Fuzzy numbers are based on the specification of a distribution function. The distribution function may be a probability or a possibility function. Probability is more difficult to determine than possi-bility. Still, the possibility function may provide all information relevant for the user. Thus, provid-ing the possibility function may be sufficient to improve the data quality description.
The paper uses the Austrian cadastre as an example. The separation between legal and technical in-fluences allows the specification of the possibility distributions. The example is restricted to tempo-ral and positional accuracy and completeness. The assumption of quality requirements of two user groups finally allows assessing the fitness for use based on the possibility distributions.

German abstract:
Die Beschreibung von Datenqualität basiert vorwiegend auf Zahlenangaben. Beim Arbeiten mit Da-tensätzen, die über einen längeren Zeitraum erfasst wurden, erkennt man schnell Unterschiede in der Qualität verschiedener Daten desselben Datensatzes. Alte Daten wurden mit anderer Qualität erfasst als neuere Daten und auch Rahmenbedingungen wie Höhenlage oder Zugänglichkeit können die Qualität von Teilen des Datensatzes beeinflussen. Scharfe Zahlenangaben können diese Schwankungen nicht vermitteln. Daher schlage ich die Verwendung unscharfer Zahlen zur Spezifi-kation der Datenqualität vor.
Unscharfe Zahlen basieren auf der Angabe von Verteilungsfunktionen. Das kann entweder eine Wahrscheinlichkeitsfunktion oder eine Möglichkeitsfunktion sein. Die Bestimmung der Möglich-keit eines Ergebnisses ist einfacher als die Bestimmung der Wahrscheinlichkeit. Trotzdem be-schreibt die Möglichkeitsfunktion eventuell bereits alle Umstände, welche für den Nutzer eines Da-tensatzes relevant sind. Daher kann die Verwendung einer Möglichkeitsfunktion ausreichen, um die Beschreibung der Datenqualität zu verbessern.
Der Artikel verwendet den Österreichischen Kataster als Praxisbeispiel. Die Trennung der techni-schen und rechtlichen Einflüsse ermöglicht die Angabe von Möglichkeitsfunktionen. Die Behand-lung im Artikel beschränkt sich auf zeitliche und räumliche Genauigkeit, sowie Vollständigkeit. Die Annahme von Qualitätsanforderungen für zwei unterschiedliche Nutzergruppen erlaubt es schließ-lich, die Nutzbarkeit der Daten anhand der Möglichkeitsverteilungen zu beurteilen.

Keywords:
GIS, Data Quality, Metadata, Modelling, Fuzzy Logic, Possibility Theory, Inter-operability


Electronic version of the publication:
http://publik.tuwien.ac.at/files/pub-geo_1740.pdf


Created from the Publication Database of the Vienna University of Technology.