Wikipedia Diskussion:Umfragen/Normdaten aus Wikidata

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Diese Diskussionsseite dient dazu, Verbesserungen an der Projektseite „Umfragen/Normdaten aus Wikidata“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.

Diskussionen in der Vergangenheit

[Quelltext bearbeiten]

Es wird doch mit Sicherheit an irgendeiner Stelle schon Diskussionen dazu gegeben haben, ob man diese Einbindung per WD möchte. Davon lese ich umseitig aber nichts, da werden nur pro-Argumente aufgeführt. Denn wenn nichts dagegen spräche, sehe ich den Sinn einer Umfrage nicht so recht :-) Gruß, Squasher (Diskussion) 14:26, 5. Jun. 2020 (CEST)Beantworten

Es ist die ureigene "de"-Angst, dass alles was man nicht selbst unter direkter Kontrolle hat, irgendwie böse ist, von merkwürdigen Vandalen heimgesucht wird, nur um unsere schöne Wikiwelt zu sabotieren. --mirer (Diskussion) 14:33, 5. Jun. 2020 (CEST)Beantworten
Wikidata hat halt das Problem, dass es zu spät kam – später als Wikimedia Commons – und man mit den Normdaten den Punkt „Das haben wir immer schon so gemacht“ erreicht hat. Mit Personendaten vermutlich genauso. Die enWP hat vor vier Jahren bereits die en:Template:Persondata gelöscht und ist somit komplett auf Wikidata umgezogen. Die Wikipedia-App bezieht die Beschreibung zu Artikeln ja auch von Wikidata. Jedenfalls, würden die ganzen Wikiprojekte heute, im Jahr 2020, gegründet würde jeder sagen: Ja, klar: Wikipedia = Enzyklopädie, hier ist der Mensch für Formulierungen und Recherche erforderlich. Normdaten, Stammdaten etc. = Wikidata, muss einmal eingetragen werden, dann kann man von überall auf den Datensatz immer wieder zugreifen. Vermeidung von Redundanzen. Bilder = Commons etc. Aber da eben die Wikipedia da war und man irgendwann auf die Idee kam, Normdaten mit in die Artikel zu pflegen, als Wikidata noch nicht existiert hat, ist Wikidata jetzt halt bei einigen ein ungeliebtes Kind, weil es die Arbeitsroutine verändert.
Und Vorlage_Diskussion:Normdaten/Archiv/4#Normdaten_von_Wikidata_ziehen. Es gibt natürlich vorherige Diskussionen auf der Diskussionsseiten zu den Normdaten. Aber diese Disk haben halt nur wenige auf ihrer Beo und sind dann am Sichter-Rechte-Argument verendet. --Christian140 (Diskussion) 16:36, 5. Jun. 2020 (CEST)Beantworten
Man kann auch Infoboxen mehr oder weniger komplett auf Wikidata umstellen. Man könnte sogar noch einen Schritt weitergehen und die Daten in Listenartikeln aus Wikidata beziehen. --Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 20:47, 5. Jun. 2020 (CEST)Beantworten
Wikipedia:Meinungsbilder/Nutzung von Daten aus Wikidata im ANR ist einschlägig. --HHill (Diskussion) 21:06, 5. Jun. 2020 (CEST)Beantworten
Das ist ja fünf Jahre alt. Ich habe da auch mit Kontra gestimmt und sage heute, dass das ein Fehler war. --Christian140 (Diskussion) 13:28, 6. Jun. 2020 (CEST)Beantworten

EditAtWikidata

[Quelltext bearbeiten]

Ping: @Christian140, Raymond, PerfektesChaos
Moin Moin zusammen, es wurde ja unter anderem vom Berita die Frage gestellt, wie Wikidata dann bearbeitet werden könnten. In der englischsprachigen Wikipedia gibt es ein en:Module:EditAtWikidata und die Vorlage en:Template:EditAtWikidata, die direkt an die richtige Stelle leiten, wenn es gut eingestellt ist. Da ich aber leider die Module etc. nicht bewerten kann, vllt. kann da PerfektesChaos mal ein Auge werfen? Das wird auch in der englischsprachen Version der Normdaten verwendet und in vielen anderen Datenbanklink sowie Infobox die Daten aus Wikidata beziehen. Nur mal so als Idee? mfg --Crazy1880 22:06, 5. Jun. 2020 (CEST)Beantworten

Da soll es mittelfristig Abhilfe durch eine neue Funktion geben, die unter dem Namen Wikidata Bridge zurzeit von WMDE entwickelt wird. Mehr oder weniger soll man in der Lage sein, in einer Infobox von Wikidata bezogene Werte innerhalb der Wikipedia-Oberfläche zu bearbeiten; die Screenshots deuten an, dass das dann ein bisschen aussieht wie der Visual Editor. —MisterSynergy (Diskussion) 23:44, 5. Jun. 2020 (CEST)Beantworten
@Crazy1880 Das grundsätzliche Problem ist, das die großen Wikis general nur Daten von Wikidata wollen, die auch Quellenangaben haben. Entsprechend muss ein Tool, dass von den großen Wikipedia's Daten in Wikidata einflegt es ermöglichen Quellenangaben zu machen. Entsprechend ist der Aufwand ein Tool zu erstellen, was von Wikipedia Daten in Wikidata einspeißt etwas höher. WMDE arbeited da aber momentan mit der Wikidata Bridge dran. --ChristianKl (Diskussion) 12:48, 18. Jun. 2020 (CEST)Beantworten

Wurgl/Fehler GND

[Quelltext bearbeiten]

Ping: @Christian140, Wurgl, Kolja21, Silewe
Moin Moin zusammen, ich möchte hier dann auch nochmal zentral auf die Ergänzung bzw. Fehler"ausmerzung" der GND- und VIAF-Daten eingehen, da Christian140 die Liste und deren Abarbeitung wahrscheinlich so nicht kennt. Hier werden Datenbank-Dumps von Wikipedia und DNB ausgewertet und entsprechende Vorschläge zentral auf die oben genannte Seite geschrieben (genaueres könnte Wurgl sagen). Anschließend geht man durch und schaut, ob die Daten zueinander passen und übernimmt es in den Artikel. Fehler werden geklärt oder auf andere Fehlerlisten geschrieben. (Ich für meinen Teil übertrage fehlende GND-Daten auch an Wikidata!) Meine Frage wäre dann ja auch mal, ob man die Liste hier behalten könnte und dann entsprechend Wikidata zusätzlich auswertet oder wie? Und als weiteres, die Fehlerlisten auf Wikidata besagen ja nichts über falsche Daten, meist nur über Dopplungen. Vllt. müsste man da auch noch was entwickeln, aber das müssten andere sagen. @Christian140, viel Spaß beim mal anschauen der Listen. mfg --Crazy1880 22:16, 5. Jun. 2020 (CEST)Beantworten

+1. Wie oben vermerkt, wird hier der zweite vor dem ersten Schritt empfohlen. Erst müsste man sich darum kümmern, dass in Wikidata eine vergleichbare Wartung der Normdaten stattfindet, dann kann man sich überlegen, ob man die Daten von dort übernehmen kann. Bitte auch bedenken, dass es nicht nur für Personen Normdaten gibt. Spätestens bei den Sachbegriffen ist Chaos vorprogrammiert. --Kolja21 (Diskussion) 22:23, 5. Jun. 2020 (CEST)Beantworten
+1 ähnliches wollte ich gerade auch schreiben. Danke Kolja21. --Silke (Diskussion) 22:33, 5. Jun. 2020 (CEST)Beantworten
Ich fang mit einem x-beliebigen Beispiel an. Das ist wirklich der erste Klick den ich gemacht hab:
Irgendwo in dem Absatz: Wurgl/Fehler GND#=== Q-25 ===
Wenn man die GND anklickt, dann steht dort "Zugehöriger Artikel in Wikipedia" und die Daten dieses Links sind im Dump enthalten. Genau diesen Vorschlag mach ich. Die VIAF ist bei Wikidata vom User Benutzer:M2k~dewiki eingetragen und der hat das gemacht, weil der initiale Autor diesen Eintrag gemacht hat, also blind übertragen. Bei der DNB steht "Österreich" und als Beruf "Architekt" in der deWP ist es ein Deutscher und offenbar Jurist. Sollte klar sein, dass dies ein Blödsinn ist. Und es ist egal, ob der Blödsinn durch die deutschsprachige Wikipedia oder die für die Sprache der Villa Kunterbunt eingetragen wurde. In Wikidata steht Käse, der Käse wird nicht besser weil er bei uns ebenfalls steht.
Ein zweiter, wieder x-beliebig angeklickter aus dem selben Abschnitt. Wiederum: Bei der DNB ist der Link "Zugehöriger Artikel in Wikipedia" die Datenbasis für den Vorschlag. Der passt wohl, importiert aus der französischen Wikipedia. --Wurgl (Diskussion) 22:48, 5. Jun. 2020 (CEST)Beantworten

Was mir auffällt

[Quelltext bearbeiten]

Hier geht es ja um Normdaten. Dazu kann ich nicht viel sagen, außer, dass mir der Umgang mit Normdaten schwerfällt (ich weiß auch nicht, ob die wirklich so wichtig sind, wie hier alle zu glauben scheinen, aber darum geht es hier ja nicht).

Meine Erfahrungen mit Wikidata sind einfach ziemlich schlechte Erfahrungen. (ich weiß, dass man so was nicht sagen soll) Ich habe da so einiges ausprobiert und musste leider feststellen (zuletzt im Zusammenhang mit der Aktion "Frauen in Rot"), dass die Daten in Wikidata zu einem sehr großen Teil einfach schlecht gepflegt sind Ich kann nicht sagen, ob 20 oder 30 %, vielleicht auch mehr). Das hat nichts mit dem hier vielbeschworenen Vandalismus zu tun, es wird einfach schlampig gearbeitet. Vielleicht betrifft das ja nicht so sehr die Normdaten, mir fallen halt die vielen entweder fehlenden oder einfach falschen Einträge auf. Woher das abgrundtiefe Vertrauen in die Daten kommt, das sich auf der Vorderseite kundtut, ist mir schleierhaft. Ich weiß nicht, ob sich wirklich die meisten der mit "Pro" Stimmenden schon mal näher mit Wikidata befasst haben. (wobei es, ganz am Rande, recht schwierig ist, in Wikidata sich zurechtzufinden, die Tutorials taugen m.E. nicht viel, sind nur zu einem kleinen Teil übersetzt, ohne jedes didaktische Talent gewerkelt usw. Aber vielleicht ist es ja einfacher, "Daten" einzutragen als Abfragen zu generieren, weiß ich nicht, interessiert mich auch nicht.) Für mich ist die Entscheidung, die Normdaten selbst herauszufinden (was auch mühsam ist und nirgends gut erklärt) oder Wikidata die Arbeit machen zu lassen (soweit es dort überhaupt Einträge gibt) wie die Wahl zuwischen Pest und Cholera. Aber das nur am Rande, die Meinung eines (in dieser Hinsicht) wenig erfahrenen Users, der mit den Top-Experten auf der Vorderseite nicht mithalten kann.

Noch eine Randbemerkung, dann höre ich bald auf. Die Argumentation: "Das haben wir schon immer so gemacht, das haben wir noch nie so gemacht, da könnte ja jeder kommen" ist natürlich bescheuert (übrigens ist das die Standard-Argumentation der deutschsprachigen Wikipedia bei allen Reformvorschlägen, nur hier nicht, interessant), Nur: Die Argumentation: "(faast) Alle anderen machen das so", ist natürlich genauso bescheuert, warum stört das eigentlich niemand? Und die Behauptung, die würden da alle problemlos damit umgehen, die glaube ich erst mal einfach nicht. Die Zustände in den anderssprachigen Wikipedien sind ja nicht so rosig, wie das hier viele zu glauben scheinen.

Jetzt mein Hauptpunkt: Auf der Vorderseite werden Diskussionen entfacht, die ja wohl hierher, auf die Diskussionsseite gehören. Sie blähen die Umfrage-Seite unnötig auf, man verliert den Überblick. Vielleicht führt das ja dann dazu, dass auch dieses Meinungsbild versandt. Aber etwas mehr Vernunft und Augenmaß hätte ich nun hier, in diesen erlauchten Wikipedianer-Kreisen, doch erwartet. Jedenfalls führt das bei mir dazu, dass ich mich andere Umfrage nicht beteiligen mag, und vermutlich geht es auch anderen so. Ich hätte auf "abwartend" plädiert oder mich gar nicht weiter geäußert. Vielleicht entschließt sich ja auch jemand, den Artikel zu renovieren. Vielleicht hat die Umfrage dann noch eine Chance ... (wie gesagt: P&C) --Kerchemer (Diskussion) 00:05, 6. Jun. 2020 (CEST)Beantworten

Was deine Anmerkungen zu Wikidata betrifft, da gehe weitgehend mit Dir konform (und hatte ja bereits schon dementsprechend votiert). Ganz besonders zustimmen tue ich Dir aber zu Deinem Hauptpunkt: Denn es ist eine Unsitte sondergleichen hier, die Abstimmungsbegründungen anderer Wikipedianer andauernd auf der Vorderseite kommentieren zu müssen. Doch leider ist das nicht nur hier so, sondern zieht sich wie ein roter Faden durch das ganze Projekt. Ich denke, dass da generell einfach mehr „Kommunikationshygiene“ eingehalten werden sollte, denn auf der Rückseite kann jedwede Kommentierung ja genauso gut bzw. viel besser gemacht werden. Doch das ist wohl in den Wind gesprochen. --Mikmaq (Diskussion) 00:24, 6. Jun. 2020 (CEST)Beantworten

Redundanz und weiteres

[Quelltext bearbeiten]

Das Riesenproblem, was ich bei Wikidata sehe, ist genau das, was der Umfrageersteller als Vorteil sieht: fehlende Redundanz. Mir ist es in den letzten Jahren schon aufgefallen: Falscheinträge verbreiten sich in zunehmender Geschwindigkeit in den Datennetzen und darüber hinaus. Es guckt einfach keiner mehr, ob das stimmt. Ein einziger Edit kann dazu führen, dass in einer ungeheuren Anzahl an Datenbanken derselbe Kram steht. Leute, das ist schlecht und nicht gut! Wir brauchen voneinander unabhängige und unabhängig geprüfte Daten nebeneinander! Dann kann man auch wenigstens verfolgen, welche Jahreszahl auf welchem Weg in welche Bibliothek gespült wurde. Bei den Normdaten ist das schon deshalb sehr auffällig, weil die eben oft nicht eindeutig sind. Auffällig ist zum Beispiel, dass mehrere VIAF-Nummern auf eine Person zutreffen und umgekehrt mehrere Personen unter einer VIAF-Nummer geführt werden. Da gibt es eben keine "richtige" Lösung, sondern mehrere halbrichtige. Und die sollten dann eben koexistieren.--Mautpreller (Diskussion) 00:21, 6. Jun. 2020 (CEST)Beantworten

Bei Personen hab ich längere Zeit wenig zugeordnet. Dass da Namensvetter bei der VIAF vermischt sind, ist leider "normal". Mehrere Wikidata-Objekte zu einer VIAF ist aber recht selten. Bei Musikbands hatte ich schon mal den Fall, dass eine VIAF gleich 5 Wikidata-Objekte geklammert hat. Natürlich war die selbe VIAF bei allen Bands eingetragen. Gut, die kann man anhand der Musiktitel recht gut auseinanderdröseln.
Was mir aber bei Personen durch die Wartungsliste Benutzer:Wurgl/DoppelteNormdaten aufgefallen ist: Manchmal (zum Glück nicht häufig) wird eine neue Biographie durch copy/paste aus einer vorhandenen erzeugt, die Texte werden dann entsprechend modifiziert, die Normdaten aber leider nicht – ganz selten werden die Personendaten auch nicht angepasst. Ist zwar nur so ein- oder zweimal im Monat, aber dennoch immer wieder. --Wurgl (Diskussion) 00:44, 6. Jun. 2020 (CEST)Beantworten

Beispiel?

[Quelltext bearbeiten]

Sehe ich das richtig, dass die Umfrage völlig ohne Beispiel auskommt? --Krächz (Diskussion) 01:23, 6. Jun. 2020 (CEST)Beantworten

Wie würde denn ein Beispiel aussehen? Würde ich einen Wikipediaartikel zu einer Person verlinken und auf die dortigen Normdaten verweisen? Und dann das Wikidata-Objekt zur gleichen Person und dort auf die Normdaten verweisen? Oder ein Vergleich mit anderen Sprachversionen in Bildern? --Christian140 (Diskussion) 07:50, 6. Jun. 2020 (CEST)Beantworten
Na vielleicht vergisst Du ganz einfach die Möglichkeit, dass diese Redundanz auch Vorteile für Wikidata darstellt?
Unsere Bordmittel zum Abgleich der Normdaten zwischen Wikidata und deutschsprachiger Wikipedia befinden sich in den Wartungskategorien Kategorie:Wikipedia:GND in Wikipedia fehlt, in Wikidata vorhanden, Kategorie:Wikipedia:GND in Wikipedia vorhanden, fehlt jedoch in Wikidata, Kategorie:Wikipedia:GND in Wikipedia weicht von GND in Wikidata ab, Kategorie:Wikipedia:VIAF in Wikipedia fehlt, in Wikidata vorhanden, Kategorie:Wikipedia:VIAF in Wikipedia vorhanden, fehlt jedoch in Wikidata.
Einen so furchtbar großen Gewinn für die deutschsprachige WP sehe ich nicht. Im Gegenteil. Wenn dieser Abgleich nicht mehr stattfinden kann, finden wir die Fehler bei Wikidata und den hiesigen Normdaten nicht mehr. --Silke (Diskussion) 09:16, 6. Jun. 2020 (CEST)Beantworten
Umseitig wird eine Umfrage für eine Änderung durchgeführt. Kann mir jemand anhand eines Beispiels verständlich machen, worum es geht? Also Zustand jetzt -> Zustand nach einer möglichen Änderung. Vielen Dank --Krächz (Diskussion) 12:26, 6. Jun. 2020 (CEST)Beantworten
@Krächz: Zustand jetzt: Aktuell fügst du {{Normdaten|TYP=|GND=|LCCN=|NDL=|VIAF=}} in die Artikel ein, im Idealfall mit ausgefüllten Parametern. Zustand nach: Danach würdest du nur noch {{Normdaten}} in die Artikel einfügen. Die Ergänzung der Normdaten erfolgt auf Wikidata. Im Idealfall sind diese schon eingetragen und werden von dir oder anderen Nutzern eingetragen. Da die Daten auf Wikidaten zuvor aus deWP übernommen wurden, ist es im Wesentlichen ein 1-zu-1-Wechsel. Ein bisschen was würde sich dennoch ändern. Aktuell werden nur vier Normdateien unterstützt, siehe de:Bong Joon-ho. Danach sehe es eher aus wie en:Bong Joon-ho. --Christian140 (Diskussion) 13:37, 6. Jun. 2020 (CEST)Beantworten

Ich versuch mich mal an einem Beispiel. Henry Bauër. Jetzt: Eingabe {{Normdaten|TYP=p|GND=1103248758|LCCN=|VIAF=53749274|REMARK=VIAF-Satz enthält auch andere Personen}}. Resultat:

Änderung: Eingabe {{Autorité}}, Resultat siehe fr:Henry Bauër#Liens externes, erster Link.

Kommentar: Unsere Vorlage hat Vorteile im Handling für Leser und Nutzer: Sie zeigt die ID-Nummern an, was für Nutzer wie mich unschätzbar wertvoll ist, wenn ein Link kaputt ist. Sie erlaubt zudem eine Bemerkung wie die, dass unter der VIAF-Nummer auch der Komponist Heinrich Bauer geführt wird, der trotz gleichen Todesjahrs nicht identisch ist. Sie hat auch Nachteile: Sie bietet keinen Link zur Bibliothèque nationale de France, der hier wertvoll wäre, und natürlich ist sie auch schwerer zu bedienen, weil man sich die Einträge angucken und prüfen und die Nummern eintragen muss, statt bloß {{Autorité}} reinzuklatschen.

Wichtig ist aber vor allem: Nicht nur der Hinweis auf VIAF (ebenso wie auf WorldCat) ist heikel, weil hier zwei Namensträger zusammengemostet sind, unter id.loc.gov sind sogar beide "Sources" falsch, weil sie sich beide auf den Musiker beziehen: http://id.loc.gov/authorities/names/no96067827.html. Dasselbe trifft zu für den polnischen Katalogeintrag. Von den zusätzlichen Datenbanklinks ist nur ein einziger sowohl korrekt als auch weiterführend, nämlich der zur französischen Nationalbibliothek. Die ganzen Identifier sind völlig unkritisch auf Wikidata hinzugefügt worden, ob sinnvoll und passend oder nicht. Geprüft wurde nichts. Nicht nur sind manche Einträge unbrauchbar, weil korrumpiert, sie sind zum Teil auch überhaupt nicht weiterführend, weil die Datenhalter gar keine Zusatzinformationen haben. So etwas möchte ich in dem Artikel nicht haben (der übrigens von mir ist, 2012 geschrieben und auf fr nur von irgendwem übersetzt).--Mautpreller (Diskussion) 13:58, 6. Jun. 2020 (CEST)Beantworten

Niemand sagt, dass eine Einbindung der Normdaten aus Wikidata so wie in der französischen Wikipedia erfolgen müsste (und niemand hat die Absicht, eine Mauer zu errichten - SCNR ;-) ). Selbstverständlich könnte auch eine Vorlage, die Normdaten aus Wikidata anzeigt, so ähnlich formatiert sein wie unsere aktuelle, mit Anzeige der ID-Nummern. Sie müsste auch nicht zwingend alle Normdaten, die auf Wikidata vorgehalten werden, anzeigen. Sie könnte sogar genau gleich aussehen. Gestumblindi 14:49, 6. Jun. 2020 (CEST)Beantworten
Technisch wäre das vermutlich möglich, praktisch halte ich das für ausgeschlossen. Der ganze Sinn dieser Idee ist doch, dass man sich die unabhängige Prüfung sparen will. Genau die wäre aber erforderlich für eine selektive Übernahme von Wikidata-Daten. Zudem gibt es auf de noch eine einigermaßen akzeptable Diskussionskultur und Leute, die zu einer solchen Prüfung fachlich in der Lage sind, auf Wikidata gibt es keins von beidem. Ich halte es für gut und nicht schlecht, wenn Angaben differieren, das bietet überhaupt erst die Chance für Fehleridentifikation und überlegten Umgang. Der Versuch, das Ganze maschinell zu lösen, führt zu einer heftigen Qualitätsverschlechterung, die ich nicht zu akzeptieren bereit bin.--Mautpreller (Diskussion) 15:01, 6. Jun. 2020 (CEST)Beantworten
(Nebenbei, wer sorgt mal dafür, dass ht:Henry Bauër zum richtigen WD-Item Q1125847 verlinkt wird und das Doppelitem Q65322927 aufgelöst wird? Das Schlimme ist ja, dass mittlerweile sogar die Interwikilinks ganz erheblich unter den Macken von Wikidata leiden.) --Mautpreller (Diskussion) 15:33, 6. Jun. 2020 (CEST)Beantworten
Hallo und danke. Es geht also nur um diese (für mich und vermutlich viele andere) kryptischen Verweise bei Personen am Ende des Artikels? Es geht also nicht darum, dass im Artikeltext oder in den Infoboxen irgendwelche Daten von Wikdate eingebunden werden? Gibt es auch für andere Gegenstände außer Personen Normdaten? --Krächz (Diskussion) 15:41, 6. Jun. 2020 (CEST)Beantworten
Bislang geht es tatsächlich nur um diese "kryptischen Verweise", dh die Links auf Daten, die von Bibliotheken vorgehalten werden. allerdings lässt sich auf der Vorderseite unschwer erkennen, dass das nur der Anfang ist, es gibt viel weiterreichende Wünsche (Infoboxen etc.). Und ja, es gibt auch für andere Gegenstände Normdaten. Bei der GND sind das "Personen, Körperschaften, Konferenzen, Geografika, Sachbegriffe und Werke, die in Bezug zu kulturellen und wissenschaftlichen Sammlungen stehen".--Mautpreller (Diskussion) 15:50, 6. Jun. 2020 (CEST)Beantworten

Jetzt mal doch noch ein paar Fragen, weil es ja heißt, man soll "auf Wikidata korrigieren". Also https://www.wikidata.org/wiki/Q1125847.

1. Die ID von VIAF ist suboptimal, weil sich dort auch Daten über eine andere Person finden. Ich sehe keine Möglichkeit, das dort anzumerken, unter "Qualifikator" gibt es diese Option nicht. Das wäre aber wichtig. Gibt es eine Möglichkeit?

2. Von dieser "Quelle" gehen die ähnlich problematischen IDs von ISNI und WorldCat aus. Wie merkt man das an?

3. Von dieser "Quelle" gehen auch die eindeutig falschen Kennungen von LCAuth und NUKAT aus, die sich ausschließlich auf die falsche Person beziehen. Wie korrigiert man diesen Fehler?

Angeblich ist es ja so schrecklich einfach, das auf Wikidata zu "korrigieren". Na dann Freunde.--Mautpreller (Diskussion) 16:41, 6. Jun. 2020 (CEST)Beantworten

Emu hat so einige Kandidaten auseinandergedröselt. Bei einigen geht das, indem man die entsprechenden IDs mit dem Rang "deprecated" versieht, bei manchen muss man tiefer in die Trickkiste greifen und Listen von Werken hinzufügen. Und bei manchen muss eine Mail her und die VIAF muss manuell eingreifen. Es gibt auch d:Wikidata:VIAF/cluster/conflating_entities, aber da müssen andere was murmeln.
Keine Chance sehe ich, wenn bei LCAuth zwei Personen vermischt sind. Meine diesbezüglichen Mails wurden ignoriert, zumindest hat sich genau gar nichts geändert.
Bei BIBSYS (den Norwegern) konnten wir ein paar vermischte Identitäten dank Hilfe der norwegischen Wikipedia auseinanderdröseln, das hatte zur Folge, dass die VIAF zwei vermischte Personen getrennt hat.
Aber diese Zeilen beantworten deine Frage, wie man das auf Wikidata korrigiert, nur bedingt. --Wurgl (Diskussion) 17:07, 6. Jun. 2020 (CEST)Beantworten
Schlechtes Beispiel wie ich finde. Du lastest hier Wikidata ein Problem an, für das Wikidata gar nichts kann. Zum einen steht die suboptimale VIAF schon mehrere Jahre im Wikipedia-Artikel. Die Vermischung bei VIAF kann nur behoben werden, indem auf Wikidata zu der anderen Person ein neuer Eintrag erstellt wird. Die VIAF bekommt das mit und wird in nächster Zeit (genauen Ablauf kenne ich bei denen nicht) die Cluster neu bilden, sprich die hier angesprochene VIAF-ID bereinigen und eine weitere VIAF-ID mit den LoC und NUKAT-Einträgen erstellen. Die falschen LoC/NUKAT-IDs habe ich soeben als misbilligt mit dem Grund "betrifft eine andere Person" markiert. Direkt rauslöschen ist mE keine gute Idee, da sie sonst wieder jemand/ein Bot einfügen könnte. So ist aber klar, dass die misbilligten IDs nicht zu verwenden sind. Mit ISNI und WorldCat kenne mich mich nicht aus. — Raymond Disk. 17:13, 6. Jun. 2020 (CEST)Beantworten
Danke schon mal für die Erledigung von Punkt 3. Ansonsten entschiedener Widerspruch: Natürlich kann Wikidata was dafür. Auf de.wp steht seit Ewigkeiten, dass die VIAF zwar korrekt, aber suboptimal ist, weil sie eben teilweise Daten einer anderen Person enthält. Auf WD steht das nicht, weil WD dafür keine Möglichkeit hat. Und warum nicht? Weil WD nicht auf Aufklärung von Inkonsistenzen hin angelegt ist, sondern auf grenzenlose Übernahme, mit einem Wort: auf Monopolisierung. Genau das finde ich so außerordentlich schädlich. Es führt dazu, dass solche Fehler irgendwann überhaupt nicht mehr zu finden sind, weil die Unabhängigkeit der Verweise untergraben wird. Wikidata könnte ein wertvolles Werkzeug sein, wenn es auf Aufklärung statt auf Monopolisierung zielen würde. Tut es aber leider nicht. Es zielt auf Standardisierung und erleichtert die unkritische Übernahme. Jeder weitere Schrritt in diese Richtung sollte bekämpft werden. Und einer davon ist eben diese Umfrage.--Mautpreller (Diskussion) 17:24, 6. Jun. 2020 (CEST)Beantworten
@Mautpreller: Das sehe ich nun wirklich anders. Es kann so ziemlich alles hinterlegt werden, was sinnvoll ist. Man muss es nur tun, ggfs. auch einen Qualifier neu definieren, um aufzuzeigen, dass eine VIAF-ID Personen vermischt. Spontan habe ich keine Qualifier gefunden, aber vielleicht haben die hier Mitlesenden ja eine Idee? — Raymond Disk. 17:36, 6. Jun. 2020 (CEST)Beantworten
Scheint doch nicht so einfach zu sein? Wasser auf meine Mühlen. Eine Idee fände ich natürlich gut, ich will ja lieber saubere als korrumpierte Daten. Im Übrigen verstehe ich Deine Position nicht wirklich. Wikidata könnte etwas Tolles sein, wenn es nicht diese grundsätzlich falsche Ausrichtung hätte. Wenn es nämlich ein Werkzeug wäre, das man frei zu seinen Zwecken einsetzen kann, und nicht eine Blaupause, die sich von selbst überallhin verbreitet. Ich fürchte, dass die so angerichteten Schäden schon heute nicht mehr vollständig reparabel sind.--Mautpreller (Diskussion) 17:45, 6. Jun. 2020 (CEST)Beantworten
@Mautpreller: "Nebenbei, wer sorgt mal dafür, dass ht:Henry Bauër zum richtigen WD-Item Q1125847 verlinkt wird und das Doppelitem Q65322927 aufgelöst wird?": Das war eine Sache von 10 Sekunden, ich habe es soeben erledigt. Im Wikidata-Menü oben auf "More / Merge with ..." klicken und das Item angeben, mit dem verschmolzen werden soll. Wirklich eine Kleinigkeit. In Bezug auf das VIAF-Problem schliesse ich mich Raymond an. Wikidata hat diese VIAF ja sogar von uns ("imported from German Wikipedia"). Gestumblindi 17:22, 6. Jun. 2020 (CEST)Beantworten
Ja, genauer gesagt: von mir. Ich hab aber eben auch dafür gesorgt, dass das Problem dieser (prinzipiell korrekten) VIAF in diesem Wiki hier angezeigt wird. Das ginge glatt verloren, wenn man einfach "+übernehmen" würde.--Mautpreller (Diskussion) 17:26, 6. Jun. 2020 (CEST)Beantworten
@Raymond: (BK) ISNI mischt einfach alle Namen der VIAF in einen Topf und rührt um. Was mit ISNI passiert, wenn die VIAF gesplittet wird, hab ich nicht beobachtet. ISNI ignoriere ich.
Der World-Cat ist mit der LCCN verbunden. Den kannst du auch deprecated markieren. (Sorry, aber Wikidata ist doch laut deiner Aussage einfach)
Das Problem ist die VIAF.
Du hast doch gesagt, eine weitere VIAF wird erzeugt. Frage: Kommen in diese neue, zusätzliche VIAF die als deprecated markierten rein oder kommen in diese neue VIAF die richtigen Bauër mit den Punkten am ë hinein. Wenn die deprecated hineinkommen, dann ist alles okay. Wenn die Bauer (mit normalem e) hineinkommen, dann passt der Wikidata-Eintrag erst recht nicht, dann ist die VIAF nach dem Update noch falscher als jetzt. Wie willst du das lösen? --Wurgl (Diskussion) 17:32, 6. Jun. 2020 (CEST)Beantworten
@Wurgl: Ich habe - glaube ich - an keiner Stelle gesagt, dass Wikidata (uneingeschränkt) einfach ist. Ich muss schon auch oft nachdenken, wie etwas gelöst werden soll. Wie die VIAF arbeitet, weiß aber auch nur die VIAF. Wenn die VIAF in eine neue ID die richtigen Bauër mit den Punkten am ë reinschiebt, ist aber auch hier lokal das Problem da, dass die VIAF dann noch fälscher wird. Das bekommt man ja auch nicht sofort mit. — Raymond Disk. 17:43, 6. Jun. 2020 (CEST)Beantworten
damit kann man leben. Nicht alle Daten können korrekt sein, aber immerhin bleibt die Unabhängigkeit der Verweise gewahrt. Man kann dem Problem noch auf die Spur kommen. Wenn alles automatisiert ist, dann ist es eben überall falsch. Nur noch die gedruckte Literatur kann einem dann helfen, denn sie hat wenigstens eine unabhängige physische Existenz.--Mautpreller (Diskussion) 17:51, 6. Jun. 2020 (CEST)Beantworten
@Raymond: Doch! Ich bekomme das per Bot mit. Du kannst die GND in eine VIAF übersetzten, durch einen Link wie https://viaf.org/viaf/sourceID/DNB|GND-ID, also z.B.: https://viaf.org/viaf/sourceID/DNB%7C1103248758 da braucht man nur den redirect angucken und schon hat man die VIAF. Ich bekommen das mit, wenn sowas wie "REMARK=VIAF 1234 mischt" in den Normdaten steht, ganz einfach durch Vergleich der VIAF im REMARK-Feld mit der VIAF auf welche weitergeleitet wird. Die andere Änderung bekommt man mit, wenn man im VIAF-Datensatz ganz unten diesen Abschnitt "Entwicklung ..." analysiert und das Datum betrachtet. --Wurgl (Diskussion) 17:55, 6. Jun. 2020 (CEST)Beantworten

Ich erlaube mir mal noch eine kleine Korrektur: Die angegebene VIAF verschmilzt nicht zwei, sondern drei Personen. Nämlich neben dem französischen Journalisten Henry Bauër (1851–1915) noch Heinrich Bauer (1854–1915), der 1911 eine Practical History of the Violin verfasst hat, und den Musikwissenschaftler Heinrich Bauer (1922–1987), der 1974 die Suite für Harfe von Johann Simon Mayr ediert hat. Entsprechend sind die angegebenen Werke von drei verschiedenen Leuten, wobei die Lebensdaten des zweiten fälschlich auf den dritten übertragen wurden. Meines Erachtens sind diese anderen Bauers kaum artikelrelevant, ich weiß jedenfalls nicht genug, um einen Artikel über sie zu schreiben. Bin gespannt, was die Bots von Wikidata und VIAF da noch für ein Pingpong veranstalten werden.--Mautpreller (Diskussion) 15:00, 7. Jun. 2020 (CEST)Beantworten

Du kannst ein Wikidataobjekt für die anderen beiden Bauers anlegen und diesen Objekten dann die entsprechenden Normdaten-Ids zuordnen. Irgendwo hab ich mal gelesen, ein Normdateneintrag wäre für Wikidata relevanzstiftend. --Wurgl (Diskussion) 15:26, 7. Jun. 2020 (CEST)Beantworten
Die hätten dann aber alle dieselbe VIAF-ID. Die LCCN träfe auf den zweiten zu, die NUKAT-ID auf den dritten.--Mautpreller (Diskussion) 16:05, 7. Jun. 2020 (CEST)Beantworten
Keine VIAF eintragen nur NUKAT bzw. LCCN. Oder die VIAF mit "deprecated" dort eintragen, "Grund der Zurückweisung": "Vermischung /merge of identities (oder so)". Ende des Monats kannst dann nochmals gucken, dann sind die (hoffentlich) auseinandergedröselt. --Wurgl (Diskussion) 16:19, 7. Jun. 2020 (CEST)Beantworten
Habs mal versucht: https://www.wikidata.org/wiki/Q96107618 und https://www.wikidata.org/wiki/Q96108054 . Wer sich auskennt, mag gern korrigieren. Mal schaun, was passiert.--Mautpreller (Diskussion) 17:13, 7. Jun. 2020 (CEST)Beantworten

Fleißige versus Genaue

[Quelltext bearbeiten]

Ich bearbeite in wp und auf Commons hauptsächlich Adelsgeschlechter (ok, eine kleine Nische ;-). Die Schwierigkeit dabei ist die verschiedene Schreibweise durch die Jahrhunderte und die verschiedenen Zweige (in mehreren Ländern/Staaten). zB Khuen von Belasy siehe auch den WD-Eintrag. Der Adel schreibt sich ja gern altmodisch mit -dorff, -torff, -thal etc., ist auch im Ungarischen und Tschechischen so. Kuen wäre die aktuelle Schreibweise, siehe Markus Kuen. Oder zB die Schweizer/österr. Familie „In der Mauer/Indermauer“, siehe die history auf WD. Sehr fleissige Kollegen oder sogar bots legen irgendwelche Daten in WD an, ohne wirklich Ahnung davon zu haben. Das ist gut gemeint, aber öfters nicht hilfreich. Auf Commons gibt es so viele unkategorisierte Einträge, da könnte man stundenlang zuordnen. Wenn ein Thema bei mir aufpoppt (= ein Artikel zu einem Adelsgeschlecht), kontrolliere ich die Einträge in wp (zu Personen selben/ähnlichen Namens) und dann auf Commons und eventuell auch noch WD. Das ist zeitaufwendig, aber wenn ich fertig bin, ist meist ein bisschen mehr Ordnung in der gesamten wiki-Familie. ;-) Und so ist es wohl in vielen Bereichen, wo etwas Hintergrundinfo für eine korrekte Zuordnung notwendig ist (zB ist das richtige Geburtsdatum vor Einführung der staatlichen Standesämter oft nicht exakt zu erfassen, weil ja nur das TAUFdatum aufgeschrieben wurde. Korrekt wäre daher „getauft am 1. 2. 1345“ zB und nicht „geboren am …“. Soweit meine Erfahrungen zu dem Themenkomplex. EINE RICHTIGE Datenbank wäre natürlich ideal, aber dazu braucht es auch eine Qualitätskontrolle (oder den Beleg der Richtigkeit), manchmal ist die Sache ja auch umstritten oder unklar. --Hannes 24 (Diskussion) 11:49, 6. Jun. 2020 (CEST)Beantworten

Lokal

[Quelltext bearbeiten]

Ich werde in den Artikeln, die ich beobachte, unter allen Umständen die Daten vollständig lokal vorhalten.--Mautpreller (Diskussion) 12:07, 6. Jun. 2020 (CEST) Schon allein aus Gründen der notwendigen Redundanz. Es ist unbedingt erforderlich, dass in de eine unabhängige Prüfung stattfindet, sodass die Wikidata-Daten und die WP-Daten jeweils einzeln unabhängig geprüft sind. Eine schlichte Übernahme aus einer externen Quelle kommt für mich einfach nicht infrage.--Mautpreller (Diskussion) 12:16, 6. Jun. 2020 (CEST) Und natürlich ist Wikidata eine externe Quelle, im Vergleich zu anderen Katalogen sogar eine Quelle minderer Qualität. Das Schlimme ist, dass Wikidata diesen Anspruch gerade nicht erhebt. Es übernimmt einfach jeden Schrott, am besten botgestützt. Doch auch von besseren Quellen kommt eine kritiklose Übernahme überhaupt nicht in die Tüte.--Mautpreller (Diskussion) 12:21, 6. Jun. 2020 (CEST)Beantworten

Bevor man entsprechende Daten lokal entfernt, sollte man natürlich prüfen, ob diese mit denen auf Wikidata identisch sind. Ist das nicht der Fall, müssen diese ggf. auf WD korrigiert werden. Werden die Daten später auf WD geändert, egal ob manuel oder automatisch, muss die Änderung überprüft werden, genauso, wie man das lokal machen würde.
In diesem Sinne ist WD gar keine Quelle, sondern lediglich der Speicherort. Die Quelle ist und bleibt bei Normdaten der jeweilige Link, den die Vorlage erzeugt. --Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 15:01, 6. Jun. 2020 (CEST)Beantworten
Nein, die lokalen Daten müssen bleiben, sonst wird per Botänderung ständig Schrott aus Wikidata hereingespült. Es ist übrigens nicht mal möglich, in Wikidata einzugeben, dass eine VIAF-ID verschiedene Personen zusammenwurstet. Bei uns geht das. Wikidata ist natürlich auch nicht nur der Speicherort, dort werden inhaltliche Entscheidungen getroffen, sehr oft falsche, die man dort nicht diskutieren kann. Für mich bleibt es dabei, ich werde in den von mir bearbeiteten Artikeln jeden Versuch einer automatischen Übernahme augenblicklich revertieren.--Mautpreller (Diskussion) 15:09, 6. Jun. 2020 (CEST)Beantworten
Dein Gezeter gegen Wikidata geht wirklich an der Realität vorbei. Wer derart unseriös mit dir in anderen Themen diskutiert, kann sich für gewöhnlich ordentlich was anhören.
Da wird nicht ständig per Bot Schrott reingespült - schon gar nicht vorhandene Daten überschrieben. Und natürlich gibt es dort auch Diskussionen & Entscheidungen und die sind mit Sicherheit nicht öfter "falsch" oder "richtig", als hier auch.
Wenn etwas auf Wikidata nicht geht oder nicht so geht, wie man das möchte oder in Zukunft handhaben möchte, kann man das ändern. Ob die Motivation dafür eine Erklärung zu einer VIAF-ID in einem deiner heiligen Beiträge sein kann, wage ich zu bezweifeln. Falls es dir gelingt einen Nutzen für mehr Personen darzulegen, finden sich auch dort i. d. R. Unterstützer und dann werden Dinge angepasst. Insgesamt ist Wikidata doch noch deutlich flexibler, als "de" - richtet sich aber halt auch nicht nach der einzig wahren Einzelmeinung.
Nebenbei ist das hier eine Umfrage und noch kein Meinungsbild, geschweige denn ein Vorschlag, wie das jetzt umgesetzt wird. Jetzt schon anzukündigen es auf jeden Fall besser zu wissen, als evtl. alle anderen und an evtl. zu fällende Beschlüsse nicht zu halten ... na ja, kann sich ja jeder selbst ein Bild davon machen. --mirer (Diskussion) 21:11, 6. Jun. 2020 (CEST)Beantworten
Ja, wo kann man denn in Wikidata einigermaßen vernünftig diskutieren? Versucht hab ich das, einen Ort, wo das halbwegs geht, hab ich nicht gefunden. Das Problem ist schlicht, dass Wikidata noch schlechter als die Wikipedia mit Uneindeutigkeiten, Widersprüchen, Unklarheiten, Ambivalenzen etc. umgehen kann. VIAF-IDs vermischen in sehr vielen Fällen (wahrscheinlich Tausenden) die Identitäten mehrerer separater Personen. Das ist seit langem bekannt (auch auf Wikidata, dort gibts sogar eine Liste). Dennoch "braucht" anscheinend niemand diesen Hinweis. Er stört halt. Man will doch eindeutige Daten, mit denen man Infoboxen beschicken kann, Zweifelhaftes mag man nicht, weil es schlecht in Infoboxen passt. Zum Schrott: Doch, es werden durch stets neue Botläufe immer wieder dieselben falschen Daten "eingepflegt", die kommen ja schließlich aus anerkannten Datenbanken. Da hilft es gar nichts, wenn man sagt: Du, die Datenbank ist gut, aber sie enthält halt auch Fehler. Man kann das nicht einfach so übernehmen. Bots hören nicht zu. Und wenn wir die Daten aus WD übernehmen, kommt dieses Zeug dann halt wieder hierher. Da ist es egal, wenn seit zehn oder fünfzehn Jahren bekannt ist, die Angabe ist falsch, kommt halt immer wieder zurück. Man kann so arbeiten wollen, ich will es nicht.--Mautpreller (Diskussion) 21:26, 6. Jun. 2020 (CEST)Beantworten
Ich würde das (Wikidata:Forum) benutzen. Bots können von den Betreibern auch abgeschaltet werden. Wenn man einen durch einen Bot verursachten Fehler findet, kann man dem Entwickler ja bescheid sagen. --Christian140 (Diskussion) 22:20, 6. Jun. 2020 (CEST)Beantworten
(BK) Letzteres funktioniert in der Tat nicht durch löschen des "falschen" Eintrages. Wie Raymond schon an anderer Stelle erklärte müssen wir dann dem Wert (der halt irgendwo verewigt ist) einmal den Rang "missbilligt" zuweisen. Dieser Rang wird von Bots nicht geändert. Wenn der Wert gelöscht wird, dann schlagen (manche - glücklicherweise nicht alle) die Bots wieder zu. Ich finde da auch manches nervig, aber wie gesagt, auch auf Wikidata sind Änderungen möglich. Auch gute. ;-)
Wie man zu VIAF-IDs einen Hinweis (Rang, Kommentar, Qualifikator oder was auch immer ...) weitergeben könnte kann man dort diskutieren. Ist nicht mein Gebiet, daher hoffe ich, dass jemand anderes hierzu eine gute Anlaufstelle und evtl. erste Ideen hat. Wenn das Problem ja größer ist, wird das auch andere Nutzer dort interessieren. Ggf. kann man es auch in "en" noch mal ansprechen, mit Hinweis auf eine Disk auf Wikidata, wo man Ideen der Projekte dann zusammenführt.
Ansonsten ist das "wo" auch dort immer abhängig davon, was und wen man erreichen möchte. Insgesamt habe ich den Eindruck dass manche Dinge nur zäh vorangehen und mutige Entscheidungen (oder auch mal nur die Umsetzung eines eigentlich klaren Konsenses) auch mal dauern können. Nervig, anstrengend aber eben m. E. kein Grund grundlegende Dinge nicht dort anzugehen und (was schlecht läuft) eben auch dort zu ändern. Wie schnell und unter welchen Vorbedingungen (da könnte "de" durchaus auch eine Wunschliste an Wikidata vor einer solchen Umstellung stellen) dass dann geschehen kann, ist wieder eine andere Sache. --mirer (Diskussion) 22:26, 6. Jun. 2020 (CEST)Beantworten
Das Problem ist, dass es noch nicht mal hier richtig klappt – wieso dann ausgerechnet auf Wikidata? Hier kann man immerhin noch in seiner Muttersprache mit ansprechbaren Leuten verhandeln, und trotzdem walzen immer wieder Bots und (fast noch schlimmer) botartig agierende Menschen drüber, die sich für die Korrektheit des Artikels kaum bis gar nicht interessieren. Immerhin gibt es Leute, die sich qualifiziert speziell um Lebensdatenfragen und Normdatenfragen kümmern. Für mich ist es bei Wikidata schlicht so: Ich kümmere mich dort um das, was mir hier auffällt, weil ich keine falschen oder irreführenden Daten mag, wo ich mich halbwegs auskenne. Mehr nicht. Die Struktur von Wikidata ist mir mittlerweile egal, ich halte sie für unrettbar. Engagieren werde ich mich dort nicht. Was mir am Herzen liegt, ist, dass es hier stimmt, und auch dort nur in meinem relativ engen Bereich. Natürlich kann Wikidata davon profitieren, aber das ist nicht meine Sache. Es braucht (möglichst viele) unabhängige "Inseln", wo es halbwegs funktioniert, nicht die eine übergreifende Datenbasis, das ist ein verfehltes Konzept. Wenn diese Inseln unterschiedlich aussehen, ist das nicht schlimm, man kann sie ja alle besuchen. Geht mir übrigens auch bei Commons so: Die Quellenangaben für Bilddateien sind oft so furchtbar, dass es einen graust. Man kann nicht mal sicherstellen, dass wirklich die angegebene Person auf einem Bild ist (Beispiel: https://commons.wikimedia.org/wiki/File:Henry_Bauer.jpg). Da gibts nur eins: Ich nehme nur das, was halbwegs zuverlässig nachgewiesen ist, sonst nichts. Wenn ich etwas klären kann, tu ich es nicht nur in der Bildunterschrift, sondern auch auf Commons. Wenn nicht, dann nicht, Commons ist nicht mein Bier, ebenso wenig wie Wikidata. Aber es spült halt auch niemand automatisiert Commons-Dateien in die Wikipedia-Artikel.--Mautpreller (Diskussion) 23:35, 6. Jun. 2020 (CEST)Beantworten
Eine Korrektur bei Wikidata reicht oft nicht. Beim nächsten Botlauf sind die Fehler wieder drin, sofern wiedermal eine Übernahme aus irgendeiner Wiki durchgeführt wird. Da hilft nur die Korrektur in derjenigen Wiki, wo es herkommt. Dann ist das Problem wenigstens erledigt. Vorerst. -- MovieFex (Diskussion) 23:48, 6. Jun. 2020 (CEST)Beantworten
Und genau deshalb ist es besser, komplett auf Wikidata umzustellen und alle lokalen Daten zu entfernen. Wenn alles auf Wikidata liegt, können die Bots auch abgeschaltet werden. Aktuell sollte nur der für die deutsche Wikipedia laufen. --Christian140 (Diskussion) 07:45, 7. Jun. 2020 (CEST)Beantworten
Liest Du eigentlich, was hier beschrieben wird? Es laufen eben immer mehr Bots, weil man aus allen möglichen Quellen Daten automatisiert abgreift, selbstverständlich ohne jegliche Konsistenzprüfung, wie sollte die auch aussehen. Wurgls hochinteressante Beschreibung zeigt doch sehr schön, was da passiert. Eine gruslige Schaukel.--Mautpreller (Diskussion) 14:01, 7. Jun. 2020 (CEST)Beantworten
@Mirer: Das Problem bei der VIAF-ID ist ein ganz spezielles. Der Datenaustausch ist bidirektional, die VIAF liest bei Wikidata und sortiert ihre Cluster entsprechend der gelesenen Daten und auch der anderen Seite lesen die Bots bei der VIAF und füllen Wikidata. Bei allen anderen IDs mag der Rang funktionieren. Bei der VIAF-Id aber nur bedingt. Das liegt einfach daran, dass unklar ist, woran die VIAF-ID klebt. Wenn ein Eintrag gesplittet wird, dann wandert die VIAF mit den gesplitteten mit oder sie verbleibt bei den übrigen. Wenn du die VIAF als deprecated markierst und sie verbleibt, dann wird sie (nach dem Split) nie mehr von den Bots zugeordnet, obwohl sie ja dann richtig ist. Wird sie nicht markiert, wandert aber mit den gesplitteten mit, dann liest der VIAF-Bot die Daten von Wikidata und fügt die beiden wieder zusammen oder ordnet der VIAF-ID zwei Wikidata-Items zu. Unterm Strich ist es egal was du machst, es ist eine 50/50 Sache. Ich selbst gehe den dritten Weg und lösche die VIAF bei Wikidata (bei den anderen Identifiern markiere ich die mit diesem deprecated), aber auch das ist eine 50/50 Chance. Ist ein Wikidata-Bot schneller als die VIAF dann wird sie wieder eingetragen und der VIAF-Bot liest diese und … siehe oben. Ist der VIAF-Bot schneller, dann liest der Wikidata-Bot die VIAF-Daten und ordnet die richtige VIAF zu. Ich hab da einfach keine Lösung und ich hab auch wenig Lust alle paar Tage/Wochen nachzugucken. --Wurgl (Diskussion) 00:12, 7. Jun. 2020 (CEST)Beantworten
Wie gesagt, da bin ich kein Experte. Prinzipiell wird das (in solch vertrakten Fällen automatischer Bearbeitungen) erst funktionieren, wenn die Botbetreiber (auf Wikidata und die VIAF-Verantwortlichen) sich da auf ein sinnvolles Vorgehen einigen. So wie ich Raymond verstehe, sollte es gerade in dem Bereich "einfach" sein die Verantwortlichen zu erreichen und das Problem darlegen zu können, da sich Wikidata hier bereits als eine Zentrale für die Datenvorhaltung etabliert hat. --mirer (Diskussion) 00:46, 7. Jun. 2020 (CEST)Beantworten

Was folgt aus dieser Umfrage?

[Quelltext bearbeiten]

Nur mal zur Erinnerung: Es handelt sich hier um eine Umfrage. Aus bekannten Gründen (keine Stimmberechtigung erforderlich, kein Auswertungsmodus angegeben) könnte sie eben nicht (wie im ersten Satz des Umfragetextes suggeriert) "klären, ob die Vorlage Normdaten ihre Daten aus Wikidata beziehen soll". Dazu ist der Vorschlag viel zu weitreichend, weil sich der etablierte Workflow deutlich ändern und de.wp in diesem Punkt ihre Autonomie einbüßen würde. Mir ist natürlich klar, dass ein Meinungsbild, welches dem ganzen eine Legitimation verschaffen könnte, nicht unproblematisch wäre, da es um eine ziemlich komplexe Materie geht, mit der sich nicht jede/r im Detail befassen mag. Ich selbst würde mich trotz einschlägiger Vorbildung da höchstens für borderline-kompetent halten. Daher die Frage: Was passiert nach dieser Umfrage, wie auch immer sie ausgehen mag? Grüße, Stefan64 (Diskussion) 12:58, 6. Jun. 2020 (CEST)Beantworten

Danke. Ich fürchte nämlich, der Umfrageersteller hat genau das im Sinn, eine grundlegende Änderung vorzunehmen, ohne ein formales Meinungsbild zu veranstalten. Das wäre ganz sicher nicht akzeptabel und müsste umgehend zurückgesetzt werden.--Mautpreller (Diskussion) 13:10, 6. Jun. 2020 (CEST)Beantworten
Dieses Problem sehe ich auch. Ich habe mich zwar umseitig für den Vorschlag ausgesprochen, aber der Initiator Christian140 sollte sich darüber im Klaren sein, dass man aus Umfragen keine direkten Aktionen ableiten kann. Sollte er das Ergebnis dieser Umfrage ermutigend finden, wäre der nächste Schritt dann ein reguläres, formelles Meinungsbild, in dem zur Stärkung der Argumentation auf diese Umfrage verwiesen werden könnte. Gestumblindi 13:46, 6. Jun. 2020 (CEST)Beantworten
Ich habe mal das inhaltliche Ergebnis vom MB von 2015 hier kurz zusammengefasst:
Angenommen
  • Die Einbindung von Wikidata-Daten ist unter bestimmten Bedingungen erlaubt.
  • Das Einbinden von Wikidata-Daten ist nur zulässig, wenn dazu ein externer Beleg vorhanden ist.
  • Die Einbindung von Daten darf nur über Vorlagen mit Hilfen zur Rückverfolgbarkeit und leichteren Erkennung erfolgen.
Abgelehnt
  • Das Einbindung von Daten aus Wikidata ist ohne besondere Einschränkung erlaubt.
  • Das Entfernen von lokal vorhandenen Daten ist nicht zulässig.
  • Die Anzeige von Wikidata-Daten ist nur zulässig, wenn ausreichender Schutz gegen Vandalismus vorhanden ist.
Es galt bei allen Fragen die einfache Mehrheit. --Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 17:42, 6. Jun. 2020 (CEST)Beantworten
Richtig, eine Umfrage ist nicht verbindlich. Will Christian140 seine Idee umsetzen braucht er dazu ein MB (erst Recht da wir 2015 bereits die Nutzung von Daten aus Wikidata per MB eingeschränkt haben). Sollte er es ohne MB einfach durchdrücken wollen ist dieser Versuch umgehend rückgängigzumachen. -- Chaddy · D 21:01, 6. Jun. 2020 (CEST)Beantworten
Der umseitige Vorschlag ist nach meinem Ermessen vollständig mit den Einschränkungen des 2015er-Meinungsbildes kompatibel. —MisterSynergy (Diskussion) 21:24, 6. Jun. 2020 (CEST)Beantworten
Nein ist er nicht:"Das Entfernen von lokal vorhandenen Daten ist nicht zulässig". --mirer (Diskussion) 22:37, 6. Jun. 2020 (CEST)Beantworten
Ich denke, das hat User:Morten Haan oben einfach missverständlich aufgeschrieben. Das Meinungsbild selbst und auch Wikipedia:Meinungsbilder/Archiv#2015 (ANR) sind da eindeutig. Es wurde abgelehnt, dass das Entfernen von lokalen Daten nicht zulässig ist. —MisterSynergy (Diskussion) 23:02, 6. Jun. 2020 (CEST)Beantworten
Oh sorry, hatte mich auf das obenstehende mal verlassen, da dazu kein Widerspruch kam. Davon unabhängig würde ich eine solch weitreichende Änderung nicht einfach Hopplahopp nach einer Umfrage umsetzen. Das wird schiefgehen. Hier sind sehr viele Artikel über alle Themengebiete betroffen, ein funktionierender Arbeitsbereich und es gibt qualifizierte inhaltliche Bedenken.
Das Meinungsbild sollte dem Geiste nach ja dazu dienen, dass in einzelnen Bereichen (insbesondere schlecht oder schwer pflegbare Daten) dann von Fachbereichen durch Wikidata per Vorlagen befüllt werden können. --mirer (Diskussion) 23:08, 6. Jun. 2020 (CEST)Beantworten

Das (Umsetzen nur auf Basis dieser Umfrage) wird doch auch niemand machen. Was auf eine Umfrage folgt, ist doch i. d. R. abhängig vom Ergebnis derselben. Ich würde da vorher auch nichts ankündigen, man muss ja schließlich offen für die Ergebnisse sein.
So sieht man ja hier z. B. dass neben einigen technischen Bedenken, es vor allem auch ein menschliches geben wird. Wir haben offenbar eine sehr aktive Gruppe, die in diesem Bereich recht sorgfältig arbeitet. Damit muss man umgehen - einfach zu erwarten, dass die gleiche Arbeit (qualitativ und quantitativ) auf Wikidata geleistet wird, wäre naiv. Ebenso die Annahme dass keiner der Beiteiligten (und auch sonst niemand) auf Wikidata sich um die Pflege kümmern würde und nur noch vandalierter Bottschrott hier reingespült würde.
Ob es also danach ein Meinungsbild, einen weiteren Meinungsbildungsprozess oder eben (erst mal) gar nichts ergibt, wird man sehen - wenn man denn den Charakter einer Umfrage ernst nimmt. --mirer (Diskussion) 21:22, 6. Jun. 2020 (CEST)Beantworten

Dein Wort in Gottes Ohr.--Mautpreller (Diskussion) 21:13, 8. Jun. 2020 (CEST)Beantworten

Wikidata-Eintrag nicht gefunden

[Quelltext bearbeiten]

oder eben Benennung und Q stehen oben auf der Seite. Aber nur wenn man die entsprechende Option aktiviert hat. Sonst gibt es keinen bequemen Weg zu Wikidata. Das müsste zunächst umgestellt werden.

Und bei Wikidata müsste endlich "oben" und an passenden Stellen auch "zwischendurch" etwas eingefügt werden.

Wer schon einmal bei den Interwikis oder bei den hier angesprochenen Normdaten was einfügen wollte, weiss was ich meine: Scrollen ohne Ende, besonders bei Schachspielern, die Hunderte von Elo-Zahlen vorweisen. --Bahnmoeller (Diskussion) 15:03, 6. Jun. 2020 (CEST)Beantworten

Ich weiß nicht genau was "oder eben Benennung und Q stehen oben auf der Seite" bedeuten soll, aber es gibt jedenfalls verschiedene Möglichkeiten, auf Wikidata zu verweisen. Mit Modulen kann man Wikidata ggf. direkt eigebettet im Wikipediaartikel bearbeiten. Aber da Wikidata ja bisher in der deWP kaum genutzt wird, kenne ich mich damit auch nicht so aus. Jedenfalls, wenn Wikidata mit einem Artikel verknüpft ist, ist ja links in der Navileiste immer ein Wikidatalink. Ansonsten macht die enWP hinter Daten, die aus Wikidata kommen, immer ein kleines Icon was beim Hovern anzeigt "edit on Wikidata" und wenn man drauf klickt kommt man direkt zur entsprechenden Eigenschaft des Objekts auf Wikidata. Die spanische Wikipedia verweist in jeder oder fast jeder Infobox auf das Wikidata-Objekt samt ID und Link und nochmal an Ende des Artikel, ähnlich wie bei uns auf Commons verwiesen wird.
Du könntest immer die "Ende"-Taste auf deiner Tastatur nutzen, um direkt an die Stelle zu kommen, wo man weitere Eigenschaften hinzufügen kann.
Ich habe mir ein paar Schachspieler mal exemplarisch angesehen und muss sagen, das ist ja Vorbildhaft, wie da diese Elo-Zahlen gepflegt werden. Genau dafür ist eine Datenbank da. --Christian140 (Diskussion) 17:42, 6. Jun. 2020 (CEST)Beantworten
.Das du nicht verstehst was ich meine ist der beste Beweis für meine These. Das ist nämlich nur sichtbar, wenn der Benutzer irgendwo tief in seinen Einstellunge und scripten geschraubt hat.--Bahnmoeller (Diskussion) 13:48, 23. Jun. 2020 (CEST)Beantworten
dies zeigt, dass der Zugang zu Wikipedia (als Gesamtsystem) ein vielfältiger ist. Leute haben unterschiedliches Wissen (auch EDV-technisch), ich persönlich finde die Bearbeitung von WD schrecklich (ich mach das auch nicht so oft), das ist einerseits zu kompliziert (technisch), andererseits zu offen (jeder kann dort fuhrwerken). Bisher hat das offensichtlich noch niemand umfassend getan. Aber wie ist WD gegen Vandalismus geschützt? Es reicht aber schon eine falsche Eingabe (durch Vertippen). Die sind die Hauptbedenken. --Hannes 24 (Diskussion) 20:23, 6. Jun. 2020 (CEST)Beantworten
Ich bin durchaus vom Fach und tat mich am Anfang mit der Bearbeitung auch schwer. Bei manchen Dingen bin ich heute noch unsicher, wie man es am Besten macht. Was aber auch mal daran liegt, dass es für manches dort eben nicht den einzig glückselig machenden Weg gibt und einem fünf Formalnazis gleich 37 (Pseudo-) Regeln um die Ohren hauen, wenn man etwas mal anders macht.
Der Einstieg hier ist auch nicht einfacher, schau dir mal den Quelltext eines Artikels mit Infobox und ggf. einer Tabelle an und ein Neuling kapiert auch da nix bis wenig. Hier wie drüben hilft halt, wenn man eine Motivation hat etwas zu ändern und dass dann Stück für Stück entdecken und ausprobieren kann. Da wird einem auf Wikidata auch die entsprechnde Geduld und Hilfestellung entgegengebracht. --mirer (Diskussion) 21:33, 6. Jun. 2020 (CEST)Beantworten
Wenn man einen einigermaßen modernen Bildschirm (und Auflösung) hat, dann sind die Interwikilinks ganz oben! Aber an den Einstell- oder "Vorwahl"-möglichkeiten für gewisse Ansichten (oder gewisse Dinge auszublenden) hat Wikidata natürlich noch Luft nach oben. Es wird hier aber immer so getan, als sei Wikidata und die Community dort in Stein gemeißelt und undabänderbar. Das ist beides nicht. --mirer (Diskussion) 21:33, 6. Jun. 2020 (CEST)Beantworten
Kurz: das glaube ich nicht. Die Interwikis kommen unter den Identifikatoren. --Bahnmoeller (Diskussion) 13:48, 23. Jun. 2020 (CEST)Beantworten
Nun, du musst dein Brauserfensterchen 1570 Pixel breit machen. Oder breiter. --Wurgl (Diskussion) 14:03, 23. Jun. 2020 (CEST)Beantworten

Rückwärtssuche

[Quelltext bearbeiten]

Wenn bei Eingabe von VIAF hier bei de.wp automatisch das Wikidata-Item gefunden würde... Wikidata ist überfüllt von Namensträgern aus irgendwelchen Datenbanken zu Diplom- oder Masterarbeiten, die einen Namen mit einer Ordnungsnummer verknüpfen. Da macht es wirklich keinen Spass, zu raten, ob irgendeiner von denen unsere Kandidatin ist. --Bahnmoeller (Diskussion) 15:03, 6. Jun. 2020 (CEST)Beantworten

Es ist noch nicht hübsch/nutzerfreundlich aber hier ist zB die passende Suche um das Item (oder mehrere) zu finden das ORCID-ID 0000-0002-9079-593X hat: https://www.wikidata.org/wiki/Special:Search/haswbstatement:P496=0000-0002-9079-593X Für andere Datenbanken einfach P469 durch die passende Property-ID für die Datenbank ersetzen. --Lydia Pintscher (WMDE) (Diskussion) 19:46, 6. Jun. 2020 (CEST)Beantworten

Personendaten

[Quelltext bearbeiten]

@JTCEPB, Mirer: ich pinge euch an, weil ihr Personendaten genannt habt. Seit zwei (oder sind es schon drei?) Jahren gibt es diese Liste Benutzer:Wurgl/Falsche Lebensdaten, welche Unstimmigkeiten zischen dem Artikel der Person und anderen Artikeln, in welchen die Person und ihre Lebensdaten genannt wurden, aufzeigen. Es gibt einige Fälle, in denen sich die Autoren verschiedener Artikel nicht einigen können, ob eine Person an diesem oder an jenem Tag geboren wurde oder gestorben ist (suche nach "Obacht" in der Liste). Die jeweiligen Autoren haben für ihre Zahl auch reputable Quellen. Wenn also nicht einmal innerhalb der deutschen Wikipedia eine Einigung möglich ist, wie soll das dann quer über mehrere Sprachen gehen? Im übrigen hat sich ein sehr eifriger Benutzer vom Abarbeiten dieser Liste zurückgezogen, weil diesem Benutzer die Änderungen zu viel Ärger verursacht haben. Diese Unterschiede gibt es übrigens nicht nur bei längst Verstorbenen, die gibt es auch bei quicklebendigen Zeitgenossen: Siehe Diskussion:Ruslan_Imanqulow Bei Wikidata steht übrigens auch der 2. Februar. --Wurgl (Diskussion) 15:50, 6. Jun. 2020 (CEST)Beantworten

Wenn zwei Todesdaten reputabel belegt sind und keines der beiden definitiv widerlegt ist, dann sollten in Wikidata beide angegeben werden und auch beide mit jeweils ihren Quellen. Im Wikipediaartikel sollte das auch angemerkt werden. In deinem Beispiel würde ich eine Anmerkung dahinter machen, dass andere Quellen den 6. Februar nennen, analog zu Kim Hye-ja. Wenn nur ein Tag zwischen den unterschiedlichen Angaben liegt oder genau ein Jahr würde ich auch beides direkt in der Einleitung nennen, ohne Fußnote. --Christian140 (Diskussion) 17:50, 6. Jun. 2020 (CEST)Beantworten
Bitte das nicht mit mir diskutieren, sondern mit den Autoren der entsprechenden Artikel. Ich hatte das Thema schon, es wurde nicht gewünscht. Das Thema hat es sogar in den Kurier geschafft. --Wurgl (Diskussion) 18:01, 6. Jun. 2020 (CEST)Beantworten
ich mach mal einen konstruktiven Vorschlag: Bei strittigen Themen müssten die zuständigen Sprachwikis mehr Rechte in WD haben (auch weil die idR sich die Quellen besser ansehen können). Das geht bei Personen leichter als bei Sachthemen. Personen sind wo geboren, leben in einem Kultur- oder Sprachraum und in diesem Raum wird auch zumeist über die Person geforscht. Das betrifft 90 bis 95 % der Fälle. Klar gibt es dann Ausnahmen (Exilanten, Aus-/Einwanderer, Personen mit mehreren „Leben“, sehr berühmte/umstrittene Personen, zu denen es mehrere „Sichten“ geben kann). --Hannes 24 (Diskussion) 20:34, 6. Jun. 2020 (CEST)Beantworten
Danke für den Hinweis auf die Liste. Mal schauen, ob ich dazu was beitragen kann/möchte. Ich verlinke sie auf jeden Fall mal von meiner Benutzerseite.
Meine Motivation der Erwähnung der Personendaten ist aber eigentlich eine andere. Diese Metadaten gehören (wie eben auch die Normdaten und m. E. auch die Kategorien) nicht in den Artikeltext. Früher hätte ich da gerne einfach einen Reiter "Meta" (neben "Artikel" und "Diskussion" gehabt. Heute ist der Ablageort der Wahl dann halt Wikidata. Manches geht dort ja auch sprachspezifisch - so kann man schon jetzt die weiteren Namen einer Person einer Sprache zuordnen. Diese wären also nicht notwendigerweise in allen Sprachen gleich. Sie sind es auch nicht.
Blieben im Beispiel der Personendaten noch die Einigung der Sprachen auf Geburts- und Todesdaten (und -orte). Das Fass würde ich auch (wohl noch lange) nicht aufmachen. Es sind die m. E. ungeeignetsten Daten für eine automatische Übernahme. Dort gibt es veritables Qualitätsproblem in Wikidata. Nicht einmal deshalb, weil so schrecklich viele Daten falsch wären, sondern weil die Community dort immer noch keinen Ehrgeiz (vor allem gemessen an unseren "de"-Belegregeln) entwickelt dieses Problem zu erkennen oder gar in naher Zukunft anzugehen. Denen (zumindest der überwältigenden Mehrheit) genügt als Quelle nach wie vor "Deutschsprachige Wikipedia" und das wird wohl auch der Knackpunkt bleiben/werden, an dem Wikidata erwachsen werden muss, um auch hier jemals ernstgenommen zu werden. Es hat meinem Eindruck nach weniger mit der tatsächlichen Qualität der Daten (diese könnte man verbessern und das geschieht ja auch ...), als mit mangelndem Problembewusstsein zu tun.
Ich selbst habe schon oft Lebensdaten in Wikidata eingetragen und diese auch entsprechend valide bequellt, so dass diese dann in der Regel mit Beleg (samt Datum, Autor, Zitat und Abrufdatum) bezogen werden könnten (vielleicht auch schon irgendwo werden?). Hier könnte deine Liste ggf. eine Ecke sein, in der das sinnvoll wäre.
Inhaltlich sehe ich das such so, dass bei mehreren validen Belegen diese auch genannt werden müssen. Gibt es ein immer wiederkehrendes falsches Datum oder Ort, kann der - wie von Raymond hier schon öfter erwähnt - eben auch aufgenommen und als "missbilligt" markiert werden. Was die verschiedenen Nutzer von Wikidata (das sind ja nicht nur die Wikipedias - die auch die Mitarbeiter und Beitragenden dort eben nicht nur aus dem Wikiversum kommen) dann daraus machen ist und bleibt deren Sache. Sorry für die Überlänge ... --mirer (Diskussion) 21:57, 6. Jun. 2020 (CEST)Beantworten
Danke, für die Ausführung, das „Problem“ liegt wohl nicht bei wp:de sondern bei WD. --Hannes 24 (Diskussion) 16:18, 7. Jun. 2020 (CEST)Beantworten

Für mich ist der Punkt, dass Personendaten für den Zweck der Wikipedia ungeeignet sind. Sie haben für den Leser keine Bedeutung und gem. Wikipedia:Personendaten allein den Zweck Daten zu extrahieren um es maschienenlesbar zu machen. Dafür ist Wikidata der bessere Ort. Wenn es für eine Person mehrere sich widersprechende Quellen gibt, dann ist es Aufgabe von Wikidata sich dem anzupassen.--Toledo JTCEPB (Diskussion) 10:27, 7. Jun. 2020 (CEST)Beantworten

Die Pflege von dynamischen Daten ist genau das, wofür automatisierte Übernahmen tatsächlich sinnvoll sind, selbstverständlich mit genauer Angabe der Bezugsquelle im Artikel. Also Einwohnerzahlen, Elo-Zahlen etc. Nicht aber von statischen Daten (wie eben Personendaten), die sich eben nicht "verändern", sondern allenfalls neu bestimmt werden. Dafür gibt es nämlich keine zuverlässige Bezugsquelle.--Mautpreller (Diskussion) 13:25, 7. Jun. 2020 (CEST)Beantworten
„Dafür ist Wikidata der bessere Ort.“ JA, eindeutig, ABER die Daten müssen auch stimmen!, sonst sind sie wertlos. Die Frage ist, wer kontrolliert die Richtigkeit der Daten? Doch am ehesten, die sich mit der Materie am besten auskennen. Personendaten haben sehr wohl (für manche) Leser eine Bedeutung. lG --Hannes 24 (Diskussion) 16:18, 7. Jun. 2020 (CEST)Beantworten

Beispiel Peter Müller

[Quelltext bearbeiten]

Beispiel: Peter Müller (Ministerpräsident) (ehemaliger Ministerpräsident, dann Richter des Bundesverfassungsgerichts). Seine VIAF ID ist 313095276 [1]. Aber VIAF hat den Fehler, dass er dort mit einer falschen "Library of Congress authority ID" (LCCN) n2002113416 verknüpft ist [2], die zu einem "Müller, Peter, Dr., Augsburg" gehört: ein Peter Müller, der in Augsburg über deutsches Schadensersatzrecht promoviert wurde. Dieser Augsburger Müller ist definitiv ein anderer, der Verfassungsrichter Müller hat keinen Doktor-Titel [3]. In Wikidata jedoch wurde ihm automatisch 2019 durch Auswertung von VIAF die nicht zutreffende LCCN eingetragen. Und weil die WorldCat ID mit der LCCN verknüpft ist, wurde ihm über diesen Fehler auch die falsche WorldCAT ID zugeordnet [4] (Anscheinend hat der Ministerpräsident/Verfassungsrichter Peter Müller bei LCCN und WorldCat keinen eigenen personalisierten Eintrag.) Auf ISNI werden entsprechend wie in VIAF die beiden Personen (Ministerpräsident/Verfassungsrichter und Augsburger Dr.) in einen Eintrag zusammengeworfen [5]. Wenn VIAF fehlerhaft ist (im konkreten Fall wohl aufgrund einer Bearbeitung in den USA), tragen die Bots den Fehler in Wikidata ein. Und dann wandert dieser Unsinn in diejenigen Wikipedia-Artikel, die an Wikidata angekoppelt sind, z.B. in der en-WP [6].

Wie eliminiert man den Fehler in Wikidata, ohne dass nach dem nächsten Bot-Lauf wieder die fehlerhaften Angaben drin stehen? --Pinguin55 (Diskussion) 23:02, 7. Jun. 2020 (CEST)Beantworten

Die VIAF-ID ist aber auch in der deWP. Bzw. in der deWP ist die ID https://viaf.org/viaf/15885230/, die aber auf https://viaf.org/viaf/313095276/ weiterleitet. Von daher ist dieser Unsinn ja auch in der WP, die nicht Wikidata gestützt ist. Die Bots für Normdaten sollten natürlich abgestellt werden, sobald deWP auf Wikidata läuft. --Christian140 (Diskussion) 23:14, 7. Jun. 2020 (CEST)Beantworten
(BK) Ein vergleichbares Problem hatten wir oben. Ich habe es mal nach Raymonds Vorbild und Wurgls Rat mit "Zurückweisung" wegen "betrifft eine andere Person" bei LCAuth und "Zurückweisung" wegen "Vermischung" bei Worldcat versucht, siehe https://www.wikidata.org/w/index.php?title=Q62333&type=revision&diff=1201589159&oldid=1191891356. Ob das hilft, weiß ich nicht, bin gespannt, was passiert. Die VIAF ist ein unlösbares Problem (siehe oben unter "Beispiel?"). Ich denke, dass diese Kisten im Einzelfall manchmal hinzukriegen sind, aber aufs Ganze gesehen unlösbar sind. Wikidata ist schlicht nicht für Übernahmen geeignet. Wir handeln uns an Tausenden Stellen dieses Zeug ein und sind nicht im Mindesten ausgerüstet, die Folgeschäden zu beseitigen.--Mautpreller (Diskussion) 23:20, 7. Jun. 2020 (CEST)Beantworten
Nachgereicht: Christian, siehst Du im Ernst das Problem nicht? Die VIAF ist korrekt, aber sie enthält eben auch eine andere Person. Das wäre dann nicht so schlimm, wenn die automatisierte Wikidata-Übernahme uns nicht den ganzen damit verbundenen Rattenschwanz ins Haus holen würde, den niemand bewältigen kann. Hast du denn oben nicht mitgelesen oder ist es Dir schlicht völlig wurscht?--Mautpreller (Diskussion) 23:23, 7. Jun. 2020 (CEST)Beantworten
Es kann sein, dass die VIAF mit der LCCN "mitwandert". Ich hab das noch nicht aktiv beobachtet, aber ganz generell: Entweder hat VIAF (die ja im selben Haus wie LCCN ist) eine präferierte Haupt-Normdaten an der sie "klebt" oder sie gehen nach der Mehrheit der Anzahl. Aber wie gesagt: Ende des Monats ist mit einem Update zu rechnen. --Wurgl (Diskussion) 23:29, 7. Jun. 2020 (CEST)Beantworten
Diese Fehler haben wir auch zu hauf in der Wikipedia. --Christian140 (Diskussion) 23:33, 7. Jun. 2020 (CEST)Beantworten
Aber doch nicht mit dieser Wucht und diesen Konsequenzen! Und wir haben immerhin brauchbare Tools und gute Leute und (oft) vernünftige Diskussionsprozesse in unserer Muttersprache und Bearbeitungsweisen, die wir kennen. Es sollte doch vor allem um Datenqualität gehen und nicht um möglichst viele Daten, von denen dann die Hälfte nichts taugt.--Mautpreller (Diskussion) 23:40, 7. Jun. 2020 (CEST)Beantworten
An Christian: Die de-WP hat nicht den Fehler bzgl. LCCN, die auf eine völlig andere Person verweist. Die VIAF-ID war wohl lange Zeit ihm persönlich zugeordnet, aber dann hat jemand die falsche LCCN drangehängt, die nicht zu ihm gehört. So war es ursprünglich seine korrekte ID, aber nachträglich ist ein Fehler passiert. Für VIAF stellt sich dann die Frage: ist es weiterhin "seine" ID (der fälschlicherweise noch jemand zweites zugeordnet wurde) oder hat er damit keine eigene VIAF-ID mehr. Auf jeden Fall ist das Problem wegen LCCN und WorldCAT ID in Wikidata, en-WP etc. größer als in der de-WP, denn mehrere Fehler sind schlimmer als ein Fehler.
An Wurgl: Diese VIAF-ID wurde wohl ursprünglich mit der Personendefinition "Müller, Peter (1955- )" von der DNB angelegt. Sie hängt (oder sollte hängen) an der Person des Ministerpräsidenten/Verfassungsrichters (es gibt ja noch weitere VIAF-IDs zum Namen Peter Müller). Aber dann hat wohl USA bzgl. LCCN gemeint, es gäbe nur einen deutschen Juristen namens Peter Müller. --Pinguin55 (Diskussion) 23:51, 7. Jun. 2020 (CEST)Beantworten
Wenn ich so gucke, dann war die LCCN nie bei uns im Artikel. Allerdings war die schon im März 2016 beim VIAF-Datensatz dabei: https://web.archive.org/web/20160902175041/https://viaf.org/viaf/15885230/ Hinzugefügt wurde sie in Wikidata aber nicht von einem Bot: https://www.wikidata.org/w/index.php?title=Q62333&diff=888384224&oldid=876070340 Alles andere ist schwer nachzuvollziehen. --Wurgl (Diskussion) 00:17, 8. Jun. 2020 (CEST)Beantworten
Der Nutzer hat auf seiner Seite ja stehen, dass er als Entwickler für die Library of Congress arbeitet. Er wird vermutlich immer mal wieder manuell ein Skript anstoßen und es über sein Konto laufen lassen. Teilweise hat er nämlich mehrere 100 Bearbeitungen in weniger als einer Minute. Ich habe den Nutzer auch auf seiner Disk diesbezüglich angesprochen. Allerdings ist er wohl aktuell kaum aktiv. Man könnte außerdem die {{Vorlage:Normdaten}} so gestalten wie die {{Vorlage:Filmdaten}} und gezielt einzelne Normdateien ausschließen zum Beispiel durch einen Parameter LCCN=nein. Allerdings wäre das auch redundant zu der Zurückweisungseigenschaft auf Wikidata. --Christian140 (Diskussion) 08:12, 8. Jun. 2020 (CEST)Beantworten
Das macht er über Stapelbearbeitungen (per "quickstatements"), die die Verknüpfungen der VIAF in die Wikidata-Items einfügen. Wie man auf seiner Disk sieht, ist es ein häufiges Problem, dass die VIAF-Verknüpfungen falsch sind. Hat aber offenbar nicht dazu geführt, solche Edits zu überprüfen. Es gibt eben keine auch nur halbwegs funktionierende Qualitätskontrolle auf Wikidata. Und, Leute, ehrlich: Es ist die blanke Illusion zu glauben, dass sich daran was ändern wird.--Mautpreller (Diskussion) 09:27, 8. Jun. 2020 (CEST)Beantworten
ich sag jetzt ganz frech, dass „Peter Müller“ (mit bekannten Lebensdaten) eigentlich kein Problem sein muss/kann. Denn zu diesen Personen (ab dem 18./19. Jhdt) gibt es noch viele bekannte Daten. Was ist mit Personen aus dem Mittelalter oder der Neuzeit, die (fast) gleich hießen, und von denen nicht viel bekannt ist. zB Kategorie:Gemmingen (Adelsgeschlecht) (14 Dieter/Dietrich, 16 Eberhard etc) Hier MUSS dieses System ganz versagen, denn das ist für uns Deutschsprachige schon schwierig ;-) Das sind natürlich Extreme, aber das sollte auch berücksichtigt werden. --Hannes 24 (Diskussion) 20:22, 8. Jun. 2020 (CEST)Beantworten
Ja Hannes, bloß ist es halt auch im 19. und 20. Jahrhundert gar nicht so einfach. Ich könnte Dir aus dem Stand aus diesem Zeitraum ein Dutzend Beispiele nennen, wo man eben nicht genau weiß, wann jemand geboren und gestorben ist. Richtig ist natürlich, dass das schlimmer wird, je weiter man zurückgeht. Was die Sache so schwierig macht, ist, dass weder die Systeme noch ein Großteil der User mit der schlichten Tatsache umgehen können, dass "man weiß es nicht genau" die präziseste Beschreibung ist. Gilt übrigens auch für die Normdaten. Es gibt öfter mal 2 oder mehr IDs, zwischen denen zu gleichen Teilen die Publikationen aufgeteilt sind.--Mautpreller (Diskussion) 20:45, 8. Jun. 2020 (CEST)Beantworten
+1 das hängt wohl auch stark vom Staat oder Land (den Umständen) ab. Gestern las ich einen Artikel über einen afrikanischen Flüchtling, der bei der Rückabschiebung 1994? (im Flugzeug starb). Von dem ist weder die Nationalität, noch das Geburtsjahr gesichert (weil die bewusst die Dokumente weggeschmissen oder verloren haben). Selbst Menschen aus dem 20. Jhdt aus Europa wissen manchmal nur ihr Geburtsjahr. Nicht überall auf der Welt gibt es einen funktionierenden Staat mit einer Bürokratie. --Hannes 24 (Diskussion) 20:57, 8. Jun. 2020 (CEST)Beantworten
Nochmal zur Ausgangsfrage @Benutzer:Pinguin55: Meine Bearbeitung in Wikidata hat in en die falsche LCAuth-Zuordnung beseitigt, ebenfalls die Zuordnung in ISNI, nicht aber die WorldCat-Kennung, weil diese über die (fälschlich vermischte) VIAF-ID bezogen wird ([7]). Fragt sich, was nun passieren wird. Werden Bots erneut die falschen Zuordnungen eintragen? Wird die VIAF korrigiert? Wer bekommt sie, der Verfassungsrichter oder der Augsburger Jurist? All das ist ungewiss.--Mautpreller (Diskussion) 11:19, 9. Jun. 2020 (CEST)Beantworten
Vielleicht noch eine kleine Randbemerkung: Der Artikel existiert in zwölf Sprachen. Das Problem tritt , soweit ich sehen kann, in der englischen, der norwegischen (bokmål) und der polnischen Sprachversion auf, interessanterweise mit unterschiedlicher Intensität: In pl ist der Parameter LCAuth trotz Entwertung immer noch drin. Warum? Weiß nicht, is aber so (in der englischen isser verschwunden). Die französische, niederländische und schwedische Wikipedia mögen ja über eine Normdatenvorlage verfügen, mit der sie die (falschen) Daten von WD holen könnten, sie tun es aber de facto nicht, dh setzen sie im Artikel nicht ein (und fahren damit besser, weil sie keine Fehler drinhaben). Arabisch und Chinesisch kann ich nicht beurteilen. Ergo: Die Nutzung scheint nicht grad ein weltweiter Herzenswunsch zu sein, und die hier ausprobierten Wikidata-Tricks scheinen nur in manchen Sprachen zu helfen, aber nicht in allen.--Mautpreller (Diskussion) 17:32, 9. Jun. 2020 (CEST)Beantworten
Das ist ziemlich einfach zu erklären. Das Modul in der englischsprachigen Wikipedia ist besser programmiert als das Modul in der polnischsprachigen Wikipedia. Die enWP sagt, wenn "deprecated" dann ID unterdrücken. Die polnische Wikipedia hat das nicht im Modul mit drin. Und nicht jeder Artikel verwendet die Normdatenvorlage. Vorher sollte ein Nutzer überhaupt wissen, das so etwas existiert? In der schwedischen WP ist der Artikel ja nur ein Satz lang und immer noch im Wesentlichen wie als er im Jahr 2008 angelegt wurde. Die schwedische WP hat aber erst seit 2014 eine Normdatenvorlage. Das chinesische Modul ist programmiert wie das der enWP, die Vorlagendarstellung ist etwas anders. --Christian140 (Diskussion) 17:52, 9. Jun. 2020 (CEST)Beantworten
Ist das so? Ich bin nicht überzeugt. Fakt ist allerdings, dass derzeit alle Sprachversionen in diesem Artikel, die nicht auf WD zurückgreifen, weniger Fehler haben. Auch die deutsche, die LCAuth nie drinhatte.--Mautpreller (Diskussion) 18:04, 9. Jun. 2020 (CEST)Beantworten

Vandalismus

[Quelltext bearbeiten]

@Marcus Cyron: Es gibt schon genug Vandalen: Erst gestern Oder der Kerl mit seinen 4 Stück "Abonniert AlphaLamaTV" zusätzlich zu anderem Blödsinn. Diese Zeilen sieht man auf der mobilen Version und in der App. Ich jage Vandalen nicht, ich guck alle paar Tage auf https://tools.wmflabs.org/wdvd/index.php?lang=de und jedesmal sind da ein paar zu finden. --Wurgl (Diskussion) 06:33, 8. Jun. 2020 (CEST)Beantworten

Der Vandalismus hält sich in Wikidata momentan ja durchaus noch in Grenzen, was aber auch ein Problem darstellt: Denn durch das relativ geringfügige Auftreten fallen böswillige Aktionen auch kaum auf. Und das tun sie eigentlich nur dann, wenn sie einen direkten Impakt auf die Wikipedia haben. Klassisches Beispiel: Wenn ich beispielsweise Fan des SC Paderborn 07 wäre, dann könnte ich jetzt die Beschreibung des WD-Datenobjektes Q160532 von "Sportverein aus Paderborn, Nordrhein-Westfalen" zu "Sportverein aus Paderborn und beste Fußballmannschaft Deutschlands" ändern. Selbigen Text würden dann alle WP-Leser angezeigt bekommen, die den Artikel in der mobilen Ansicht aufrufen – und das sind immerhin alle Leser, die unangemeldet ein Smartphone bzw. Tablet nutzen. Und wie lange würde eine Rücksetzung wohl dauern, wenn ich solch eine POV-Aktion im Artikel eines Bezirksligisten vornehmen würde?
Doch das mit dem Vandalismus ist ja nur die eine Seite der Medaille. Die andere und in meinen Augen viel gewichtigere ist das mangelnde Feedback, das man bei zwar gutgemeinten aber eben doch falschen Edits dort erfährt. Wenn ich jedenfalls daran denke, wieviel Unfug ich durch Unwissenheit zu Beginn meiner Wikidata-Aktivitäten angerichtet habe, dann wird mir heute noch schwindelig. Doch niemand hat mir deswegen auf die Finger geklopft: Keiner hat mir mal gesagt, dass das Quatsch gewesen wäre, was ich da gerade gemacht habe. Und ich denke, dass es vielen WD-Mitarbeitern vermutlich ähnlich ergangen ist.
Fazit: Die "Datengüte" in WD wird solange weit unterdurchschnittlich bleiben, solange es keine effiziente Qualitätskontrolle dort gibt. Und solange dieser Zustand anhält, ist ein automatischer Datentransfer WD→WP einfach nicht sinnvoll. --Mikmaq (Diskussion) 08:46, 8. Jun. 2020 (CEST)Beantworten
richtig, WD wurde (von uns hier?) nicht ernst genommen, was dort steht konnten wir nicht beeinflussen → daher war es egal und irgendwer hat irgendwas (mal) hingeschrieben, damit es nicht so leer aussieht. ;-) Wie können wir diesen Teufelskreis durchbrechen, denn EINE gute und richtige Datenbank macht schon Sinn (für das Gesamtprojekt wiki). Lösungen:
  • Problem erkennen (dürfte allgemein noch nicht so sein, siehe oben)
  • Zuständigkeiten definieren (wer darf was)
  • Testbetrieb (am besten parallel, WD und die wikis)
  • Qualität verbessern (bei unveränderlichen Daten braucht es ja nur wenige Bearbeitungen, und dann müsste es stimmen → eine weitere Bearbeitung wird die Ausnahme sein, weil es zB neuere Erkenntnisse gibt. Dh gewisse Daten sind dann gesperrt für die Allgemeinheit, nur besondere Mitarbeiter dürfen die ändern - eigentlich der gleiche Vorgang wie beim Sichten/Sperren hier in wp)
so könnte das ablaufen. lG --Hannes 24 (Diskussion) 20:42, 8. Jun. 2020 (CEST)Beantworten
Wir reden hier nur von Personendaten, es kann aber alles mögliche durcheinandergeraten wenn die Lemmata in den einzelnen WP nicht exakt gleich sind. ZB ist Technik anfällig dafür (was käme zB bei Wälzlager heraus?), und die falschen Freunde gibt es auch noch. Meine Vermutung ist, dass WD nur dort wirklich funktionieren kann wo jemand mit ausreichend Sprachkenntnis, Ahnung vom WD-Aufbau, und vom Lemma das händisch eingibt. Das setzt dann die richtige Literatur voraus - wo dann allerdings der Mehrwert sein soll, erschließt sich mir nicht so ganz.
  • Problem erkennen (nicht ganz einfach, wenn nicht gerade die Chevrolet Corvette zu einer französischen Schiffsgattung gemacht wird)

Henne-Ei-Problem

[Quelltext bearbeiten]

Das Ganze riecht mir nach einem Henne-Ei-Problem: Wir verwenden WD-Daten nicht, weil diese fehlerhalt sein können. Wenn wir diese Daten aber nicht verwenden, fallen Fehler nicht so einfach auf, weil man dazu ja explizit auf Wikidata nachsehen muss. Die dortigen Kurbeschreibungen sind auch erst in den Fokus gerückt, als man angefangen hat, sie in der mobilen Ansicht der WP zu verwenden.

Kompromiss
Anstatt die Normdaten lokal zu entfernen, kann man diese doch einfach auskommentieren. Damit werden die Daten von WD eingeblendet, man kann diese aber weiterhin mit den lokalen Daten abgleichen und bei Bedarf auch wieder anzeigen lassen.

--Morten Haan 🎢 Wikipedia ist für Leser daÜbersichtliche Artikelkriterien 17:47, 8. Jun. 2020 (CEST)Beantworten

Nö. Der Haken ist, dass man da versucht, die Wikipedianer auf Wikidata zu locken, was aber nicht funktionieren wird (außerdem merkt man die Absicht und ist verstimmt). Es gibt jede Menge Abgleichstools zwischen WP und WD, die auch funktional sind und genutzt werden. Dafür ist aber Voraussetzung, dass die Daten unabhängig voneinander erhoben und dargestellt werden, sonst ist eine Prüfung sinnlos. Es wird eben keine solche Prüfung mehr geben können, wenn alles von WD geholt wird. Prüfung verlangt gebieterisch nach genau der Redundanz, die der Umfrageersteller beklagt, sonst ist sie nicht möglich.--Mautpreller (Diskussion) 18:33, 8. Jun. 2020 (CEST)Beantworten
Wenn wir also über unseren Schatten springen, werden die vielen Fehler alle schnell erkannt und alles wird passen? Wieso ist das dann in den 19 der 22 größten Wikipedias, die das schon vor uns getan haben und bei denen angeblich alles so problemlos funktioniert, nicht passiert? Wir sprechen da über sehr viel mehr Leser und Autoren, als deWp jemals haben wird. Also, was ist an deWp so besonders, dass das alles regeln wird, was schon mindestens 19 mal offensichtlich nicht funktioniert hat? --Senechthon (Diskussion) 20:17, 8. Jun. 2020 (CEST)Beantworten
Es ist genau umgekehrt. Es funktioniert unter anderem deshalb nicht, weil man sich in vielen Sprachversionen auf Wikidata verlässt. Die Probleme, die mit Wikidata vorliegen, sind nicht zuletzt dadurch so groß geworden, weil Wikidata von so vielen Sprachversionen als Quelle automatisiert worden ist. Das ist einer der beiden wichtigen Gründe für die Fehleranfälligkeit; der andere wichtige Grund ist die Konzeption von Wikidata selbst, die eine wirksame Qualitätskontrolle verhindert. Beides ist im Übrigen auch nicht unabhängig voneinander, denn Wikidata ist eben bedauerlicherweise gerade zur Übernahme und nicht zur Dokumentation und Prüfung entworfen worden.--Mautpreller (Diskussion) 20:36, 8. Jun. 2020 (CEST)Beantworten
Leute außerhalb des Dunstkreis Deutschland + K&K-Monarchie sind viel fehlertoleranter, weniger aufgeregt und nicht auf Perfektion aus. --M@rcela 17:22, 9. Jun. 2020 (CEST)Beantworten
aus dem Dunstkreis von D und der K&K kommend und voll auf Mautprellers Linie, weil ich an und mit der Sche*** WD oft genug verzweifelt bin. Aber mal ein Vorschlag wegen Redundanz. Man nimmt WD Daten und gleicht sie mit den NDaten ab; gleich: ... WD eingefügt; falsch: bleibts bei den WP Normdaten + Fehlermeldung an WD ... Und so würde sich nach und nach WD korrigieren lassen, bis endlich alle WP Normdaten ordentlich in WD abgebildet sind... alle glücklich (nicht immer zufrieden) mfg und ja, jetzt schläge von beiden seiten erwartend --commander-pirx (disk beiträge) 17:41, 9. Jun. 2020 (CEST)Beantworten
*räusper* Wenn in WD eine Käse-LCCN steht und in deWP genau deshalb dieser Parameter leer ist, passiert was genau?
Das Problem ist ja nicht, dass Wikidata nicht korrigiert wird, sondern dass dort Hinz & Kunz (bzw. auf engl: every Tom, Dick and Harry) einfach was einfügen, was zwar dem Namen nach so ungefähr passt, aber bei genauer Betrachtung daneben ist. Entweder fügen die das per Hand ein oder per Bot. Du darfst also immer wieder korrigieren. --Wurgl (Diskussion) 18:07, 9. Jun. 2020 (CEST)Beantworten
Eine Enzyklopädie, die Perfektion nicht wenigstens anstrebt, hat ein Problem. Ein ernsthaftes.--Chief tin cloudIm Zweifel für den Artikel 10:59, 10. Jun. 2020 (CEST)Beantworten

Etikettenschwindel?

[Quelltext bearbeiten]

Ich kann mich des Eindrucks nicht erwehren, daß der Betreiber dieser Umfrage versucht, eine ihm genehme Änderung durchzusetzen, ohne das dafür notwendige Instrument eines Meinungsbildes einzusetzen. Alles ist sehr undurchsichtig formuliert, wohl um nicht zu viele Gegner aufmerksam zu machen. --Enzian44 (Diskussion) 22:10, 9. Jun. 2020 (CEST)Beantworten

Dann möchte ich bei dieser Gelegenheit an den alten Projektgrundsatz hinweisen, immer von guten Absichten aller Beteiligten auszugehen und solche Vermutungen zum Nachteil anderer zu vermeiden. Gruß, --Gnom (Diskussion) Wikipedia grün machen! 22:22, 9. Jun. 2020 (CEST)Beantworten
Ja, Gnom. #wokämenwirdenndahin #dakönntejajederkommen #dashabenwirnochniesogemacht ist sicher der Inbegriff des Von-guten-Absichten-Ausgehens und Vermutungen-zum-Nachteil-anderer-Vermeidens. Im Übrigen siehe oben den Diskussionspunkt Wikipedia Diskussion:Umfragen/Normdaten aus Wikidata#Was folgt aus dieser Umfrage?. --Mautpreller (Diskussion) 22:29, 9. Jun. 2020 (CEST)Beantworten
Was genau der Initiator vorhat, weiß ich nicht. Es ist aber nicht verboten, erst eine Umfrage und im Abschluss ein MB durchzuführen. --Morten Haan 🏄 Wikipedia ist für Leser da 🧉 Übersichtliche Artikelkriterien 23:32, 9. Jun. 2020 (CEST)Beantworten

Frage am Beispiel

[Quelltext bearbeiten]

Erstellter Artikel: Wendelin Brohm:

  • Mitglied USPD später SPD (Ortsvorsitzender) -> aber nur USPD ist in WD eingetragen, obwohl oben beide Parteien angegeben sind
  • Sterbeort wird nicht genutzt?
  • Warum werden nur die Jahre und nicht das exakte Datum in WD gespeichert?
  • ich weis, es gibt viele Träger des BVKr - aber warum wird das nicht in WD gesammelt?

mfg --commander-pirx (disk beiträge) 17:02, 10. Jun. 2020 (CEST)Beantworten

Das Beispiel hat mit der Umfrage nicht direkt was zu tun, da es in der Umfrage spezifisch um die {{Vorlage:Normdaten}}. Der Artikel Wendelin Brohm wurde von dir am 12. Juni 2019 kurz nach Mitternacht. Aber du hast kein Wikidata-Objekt dazu angelegt. Was natürlich legitim ist. M2k~dewiki hat dann am Morgen des 12. Juni das Wikidata-Objekt erstellt mit zwei Eigenschaften: "Mensch" und "männlich". Dann haben weitere Nutzer noch etwas ergänzt. Wie dem auch sei, die Antwort auf deine Fragen ist: Weil es niemand eingetragen hat. Ich habe das Mal ergänzt. --Christian140 (Diskussion) 17:48, 10. Jun. 2020 (CEST)Beantworten
(Einschib)Logo ist der Artikel von mir, deshalb ja als Bsp benutzt. Und meine negativen Erfahrungen mit WD haben mich auch mit "dagegen" stimmen lassen. Und momentan bleib ich auch dabei. Solange kein konstruktives: "ist besser als Normdaten, einfacher, weniger Fehleranfällig" rauskommt ... wird keine Mehrheit umsteigen. Wir wollen keine DB anlegen, sondern Artikel schreiben. --commander-pirx (disk beiträge) 09:20, 11. Jun. 2020 (CEST)Beantworten
Du kannst ja Artikel schreiben und musst überhaupt nicht auf Wikidata. --Christian140 (Diskussion) 11:22, 11. Jun. 2020 (CEST)Beantworten
Ja, das ist ein unproblematischer Fall, weil die Normdaten hier eindeutig und begrenzt sind. Niemand kommt auf die Idee, per Bot 250 Datenbanken einzutragen, obwohl da gar nichts Neues drinsteht, Verwechslungen sind unwahrscheinlich. Sollte es freilich irgendwann mal einen anderen Herrn Brohm geben, vielleicht mit ähnlichem Vornamen, könnte es lustig werden.--Mautpreller (Diskussion) 18:00, 10. Jun. 2020 (CEST)Beantworten

Eine Person mit zwei VIAF-IDs

[Quelltext bearbeiten]

Die Geografin Carmen de Jong besitzt zwei Personen-VIAF-IDs: 77011657 (bzgl. DNB, BnF etc.) [8] und 132157100642172740007 (mit Verweis auf LCCN [9] und Israel) [10]. Darum habe ich die LCCN vorsichtshalber nicht in WP eingetragen, aus Angst dass die Wikidata-Bots die de-WP auswerten und dann zu spinnen anfangen. Oder soll man den Test wagen? --Pinguin55 (Diskussion) 18:10, 10. Jun. 2020 (CEST)Beantworten

In dem Fall kannst es einfach tun, weil es die gleiche Person ist. Ich kenne mich mit VIAF nicht so aus, aber die checken ja gegen Wikidata gegen. Deshalb könnte es sein, dass VIAF dann beide Einträge merged. Und das wäre ja gut. Die problematischen Beispiele sind ja wo mehrere unterschiedliche Personen in einem VIAF-Eintrag vermischt werden. Wie dem auch sei, es würde nicht viel passieren. Erstens weiß ich gar nicht, ob es überhaupt einen Bot gibt, der LCCN-Einträge von deWP in Wikidata übernimmt, wegen der Schrägstriche. Das könnte man zwar einfach skripten, aber keine Ahnung ob das irgendjemand gemacht hat. Und dann müsste auch noch mal VIAF gegenchecken und die Einträge vereinen. Was gewünscht wäre. Also, einfach eintragen. --Christian140 (Diskussion) 18:25, 10. Jun. 2020 (CEST)Beantworten
Man sollte den Test wagen, weil es momentan noch völlig unbekannt ist, was dabei rauskommt. Das ist m.E. ein starkes Argument dagegen, sich auf Wikidata zu verlassen, aber ein paar mehr Informationen, was denn nun wirklich passiert, können nicht schaden. Bislang ist das kaum kalkulierbar. Gäbe man übrigens beide VIAF-IDs in WD ein, wäre das eine "Constraint violation" (denn bei IDs wird verständlicherweise "nur ein einziger Wert" erwartet. Was aber die Folge einer solchen "Beschränkungsverletzung" ist, ist weitgehend im Dunkeln. Die "Constraint violations", die ich produziert habe, hatten bislang erstmal überhaupt keine Folgen, vielleicht werden sie aber irgendwann auch in nicht vorhersagbarer Richtung aufgelöst.--Mautpreller (Diskussion) 21:18, 10. Jun. 2020 (CEST)Beantworten
Es ist nicht völlig unbekannt sondern sehr wohl bekannt und kalkulierbar. Außerdem hat das Argument nichts mit Wikidata sondern mit VIAF zu tun. „Constraint violations“ sind meist kein Problem. Dadurch landet das Objekt lediglich auf einigen Wartungsseiten weil das Optimum ein Eintrag ist. Und das ist das einzige, was sie zur Folge hat. Die Vorlage kann so eingestellt werden, dass sie entweder nur einen Wert oder eben alle mit übernimmt, ggf. durch Komma oder Schrägstrich getrennt. --Christian140 (Diskussion) 08:10, 11. Jun. 2020 (CEST)Beantworten
Du bestätigst meine Aussage im Grunde. Auch Du weißt nicht, was bei der sog. Wartung rauskommt.--Mautpreller (Diskussion) 12:57, 11. Jun. 2020 (CEST)Beantworten
Da ist entweder das Wikidata-Datenmodell falsch, wenn es legitim ist, dass eine Person mehr als einen VIAF-Eintrag hat, oder wenn das nicht legitim ist, hat VIAF Scheiße gebaut. Für so was kann man aber Lösungen finden. Solche Diskussionen wie hier entstehen leider immer wieder dadurch, dass Datenmodelle nach reiner Lehre gestrickt werden und es dann Fälle gibt, die nun mal nicht in die reine Lehre passen. Oder dadurch, dass Menschen (oder Bots, der Datenbank ist das egal) Murks in die Datenbanken schreiben. Was das betrifft, verweise ich auf Jutta Lindenthal. Die kann ein Lied davon singen, was sich in kontrollierten Vokabularen für Schrott findet. --77.3.167.180 00:14, 12. Jun. 2020 (CEST)Beantworten
Das Wikidata Datenmodel erlaubt es beide VIAF-IDs einzutragen. Der Constraint erlaubt es einem Mitarbeiter von VIAF zu sehen, dass es bei der Person Probleme mit der VIAF-ID gibt und die IDs zu zusammenzuführen in dem er sich die Seite für ConstraintViolations anschaut. Wenn die zwei IDs jedoch nicht in Wikidata eingetragen sind, sondern einfach auf Wikipedia zusammengelistet sind gibt es keinen einfachen Mechanismus wie VIAF entdeckt, dass es Zusammenlegbedarf gibt.
Je nach Authorität für Normdaten ist die Bereitschaft IDs zuzusammenzulegen unterschiedlich, aber es ist hilfreich für das Ökosystem wenn Wikidata diese Funktion zur Verfügung stellt und VIAF nutzt die Möglichkeit auch ab und zu. --ChristianKl (Diskussion) 13:08, 18. Jun. 2020 (CEST)Beantworten
@ChristianKl: Kannst du mir ein Beispiel dafür nennen? Grundsätzlich greifen die VIAF-Mitarbeiter nämlich nur über xA-Einträge direkt ein und das geht nicht selten fürchterlich schief, wie man etwa an VIAF:18015326 oder der Doppelschönheit VIAF:69695543 und VIAF:4040157416833316710000 sehen kann. Ich habe deshalb aufgehört, der VIAF zu schreiben, die Chance einer Verschlimmbesserung ist sehr hoch. --emu (Diskussion) 14:59, 18. Jun. 2020 (CEST)Beantworten
@Emu: https://www.wikidata.org/w/index.php?title=Q28131664&type=revision&diff=1046346168&oldid=1001570078 ist ein Beispiel, dass auf https://www.wikidata.org/wiki/Wikidata:VIAF/cluster/conflating_entities gelisted wird. Ich hab selbst ab und zu in Wikidata mit VIAF IDs zu tun aber meist eher mit Anatomy Normdaten. --ChristianKl (Diskussion) 00:00, 19. Jun. 2020 (CEST)Beantworten

Quantitative Auswertung zur Datenqualität

[Quelltext bearbeiten]

Im Gegensatz zu den beschriebenen Einzelfällen (annektodische Beschreibungen) wollte ich eine größere quantitative Auswertung der Datenqualität in der deutschsprachigen Wikipedia im Vergleich zu Wikidata machen. Daher habe ich in den letzten Tagen eine Auswertung von 10.000 deutschsprachigen Wikipedia-Seiten mit einem Normdatenbaustein und den dazugehörigen Wikidata-Seiten gemacht: https://de.wikipedia.org/wiki/Benutzer:Zuphilip/Analyse_zu_Normdaten Die Größenmenge sollte m.W. etwa 2-3% aller Normdateneinbindungen in dewiki entsprechen und möglichst repräsentativ sein. Die Resultate möchte ich auch hier kurz zusammenfassen:

  1. In 96,6% aller untersuchten Fällen (9.664) stimmen die beiden GND-IDs überein.
  2. In 2,5% aller untersuchten Fälle (220+36) fehlt entweder in Wikidata oder in der deutschsprachigen Wikipedia eine GND ID.
  3. In 0,8% aller untersuchten Fälle (81) gibt es unterschiedliche GND-IDs in dewiki und Wikidata.

Eine weitergehende Analyse der 81 Fälle mit unterschiedlichen GND-IDs hat folgendes ergeben:

  • Kein Fall von Vandalismus war darunter.
  • Bei den über 2.500 untersuchten Personenseiten gab es keinen Unterschied in den GND-IDs auf Wikidata im Vergleich zu denjenigen in dewiki (bis auf das komplette Fehlen in einer Datenquelle).
  • Es gibt GND-IDs in Wikidata, welche von der deutschsprachigen Wikipedia importiert wurden und dann später auf dewiki korrigiert wurden, aber in Wikidata wurde diese Änderungen dann nicht mehr nachgezogen.
  • Es gibt Konzepte von Wikipedia-Seiten bzw. Wikidata-Einträgen, welche in mehrere GND-IDs aufgehen. In Wikidata werden in solchen Fällen teilweise mehrere GND-IDs angegeben oder dann eine andere als die in Wikipedia, z.B. 4003157-3 (Arzt) und 4140665-5 (Ärztin) oder auch 2118180-9 Bundesgerichtshof (ab 1990) und 35118-0 Bundesgerichtshof (bis 1990).
  • Auch potentielle Fehler in der GND findet man in diesen untersuchten Fällen, da sich dies dann auch hier in Unterschieden niederschlagen kann.

Mein Fazit aus der Betrachtung: Die angegebenen GND-IDs und damit auch die Datenqualität ist bei Wikidata und der deutschsprachigen Wikipedia sehr ähnlich (>95%). Ja, es gibt natürlich noch Fehler und zwar sowohl in Wikidata, Wikipedia wie auch in der GND selbst. Unterschiedliche GND-Daten in Wikidata im Vergleich zur deutschsprachigen Wikipedia kommen zustande, wenn diese Daten an unterschiedlichen Stellen unabhängig voneinander weiter gepflegt werden. --Zuphilip (Diskussion) 11:38, 11. Jun. 2020 (CEST)Beantworten

Danke für die viele Arbeit. MMn geht deine Analyse ein bisschen am Problem vorbei. Denn das war eine rein technische Überprüfung (den Beispielen nach auch keine Personen). Dh fehlende oder falsche Zuordnung sind relativ leicht zu beheben (wenn man zB eine Auswertung über alle Einträge machen würde). Die Frage geht aber mehr über die schwierigen (fachlich zu beurteilenden) Fälle und über das generelle Prozedere (bei Problemen), neben Grundsätzlicherem (Kritik der Datenübernahme von „außen“- wp übernimmt ungeprüft WD). lG --Hannes 24 (Diskussion) 12:36, 11. Jun. 2020 (CEST)Beantworten
GND-Daten von mindesten 2.500 Personen wurde auch untersucht aber keine Unterschiede gefunden (vgl. den Punkt oben dazu) und darum tauchen diese nicht in der Liste der Unterschiede auf. Die Liste aller 10.000 ausgewerteter Artikel habe ich mal hier kopiert. --Zuphilip (Diskussion) 13:01, 11. Jun. 2020 (CEST)Beantworten
Der Witz ist doch grade, dass man solche Untersuchungen nur machen kann, wenn es unabhängige Datenbasen gibt. Die Redundanz ist die Bedingung dafür. Die Tools zum Abgleich zwischen Normdaten in WD und WP funktionieren doch genau aus dem Grund, weil diese unabhängig voneinander eingetragen werden. Auch die Mängelliste für die GND (Wikipedia:GND/Fehlermeldung) basiert unter anderem auf solchen Abgleichen. Wollt Ihr diese Überprüfungsmöglichkeiten, die sich ja auch auf die GND auswirken, in den Wind schießen? Die sind doch für die Datenqualität ganz entscheidend.--Mautpreller (Diskussion) 14:12, 11. Jun. 2020 (CEST)Beantworten
Nein, natürlich kann man die Datenqualität auch ohne doppelte und abweichende Daten untersuchen, aber das war nicht mein Fokus in dieser Analyse. Ganz im Gegenteil kann man in Wikidata mit einer Federated Query über lobid auch die GND-Daten abfragen und damit semantisch sehr tiefe Vergleiche machen. --Zuphilip (Diskussion) 15:09, 11. Jun. 2020 (CEST)Beantworten
Das sehe ich nicht. Alle Zweifelsfälle und Tools, die ich kenne, basieren darauf, dass zwei unabhängige Datenbasen verglichen werden. Dabei ist die Wikipedia insofern die bessere Quelle, als sie Kontext zu den Daten bietet und die Daten daher am Artikeltext überprüft werden können. So ist beispielsweise unmittelbar einleuchtend, dass ein Werk wie die Practical History of the Violin (New York 1911) eher nicht von einem französischen Journalisten stammen wird, der New York im Leben nicht gesehen hat.--Mautpreller (Diskussion) 15:46, 11. Jun. 2020 (CEST)Beantworten
@Zuphilip: Könnte man diese Daten auch innerhalb des Wiki-Universums publizieren, zum Beispiel ähnlich wie so was als commons:Data:Normdaten-Vergleich dewiki und Wikidata.tab? --77.3.167.180 14:53, 11. Jun. 2020 (CEST)Beantworten
Klar, das ist kein Problem. Ich habe jetzt einmal CC0 für die Daten dazugeschrieben, falls das jemand übernehmen möchte. Bei Interesse kann ich das OpenRefine-Projekt zur Verfügung stellen (ca. 500 MB). --Zuphilip (Diskussion) 15:23, 11. Jun. 2020 (CEST)Beantworten
@Zuphilip: Danke für die Analyse, die für mich erwartbare Ergebnisse gebracht hat. Ich zweifle nur daran, dass diese Analyse wirklich weiterhilft. Der Teufel steckt im Detail und zwar bei den schwierigen Fällen: Bei Personen sind das gleichnamige Personen (womöglich noch mit gleichen oder ähnlichen Geburtsjahren). Nur: Gerade für diese braucht man Normdaten. Und da hängt Wikidata letztlich an der (prinzipiell nicht schlechten, aber eben rein automatisierten) VIAF-Logik, die oft importiert wurde. Bei der Wikipedia sind es einzelne Fehlzuordnungen, bei Wikidata ein systematisches Problem. --emu (Diskussion) 03:39, 13. Jun. 2020 (CEST)Beantworten

Redundanz – gut oder schlecht?

[Quelltext bearbeiten]

Ich habe auf der Vorderseite wie hier in der Diskussion mehrfach Argumente gelesen, die die Redundanz zwischen Wikipedia und Wikidata gegen einen Bezug der Daten aus Letzterem anführen. Es gibt aber so was wie „gute“ und „schlechte“ Redundanz. Gut ist Redundanz gemeinhin, wenn sie benutzt werden kann, um Datenintegrität sicherzustellen – was in den meisten Fällen allerdings nicht die Intention derjenigen zu sein scheint, die sie hier anführen, wenn die Korrektur falscher Wikidata-Daten nicht in Betracht gezogen (oder als den Aufwand nicht wert eingeschätzt) wird. Problematisch ist Redundanz, wenn Daten, die eigentlich identisch sein sollten, es nicht sind, Widersprüche nicht behoben werden, die (vermeintliche) Redundanz also sozusagen mehr zur allgemeinen Verunsicherung beiträgt als zur Sicherstellung der Integrität. Unabhängig davon, ob es sinnvoll ist oder nicht, Wikipedia-Normdaten aus Wikidata zu saugen, sollte, nein, muss das Ziel sein, Integrität der Daten herzustellen, also dafür zu sorgen, dass in Wikipedia und Wikidata die gleichen Normdaten verzeichnet sind. Und wenn die Daten in der Wikipedia richtig sind und die in Wikidata falsch, dann muss das in Wikidata geändert werden (niemand verlangt, dass jeder Wikipedia-Autor das leisten kann). Umgekehrt gibt es auch Normdaten-Fehler in der Wikipedia (darunter bestimmt einige Fälle, in denen auch Wikidata falsch liegt). Ich weiß, dass manche Wissenschaftler (vor allem in den Geisteswissenschaften) so geil auf Ambiguität sind, dass sie sich über widersprüchliche Daten aus unterschiedlichen Quellen mehr freuen als über Konsistenz, aber während das bei unklaren Geburtsdaten altgriechischer Philosophen oder ausgeklügelten Interpretationen hermetischer moderner Liebesgedichte seinen Sinn haben mag, ist es bei Normdaten einfach fehl am Platze.

Was wir brauchen, ist keine Scheindiskussion darüber, wie die Qualität der Wikidata-Daten ist. Was wir brauchen, sind funktionierende Arbeitsabläufe, mit denen Inkonsistenzen redundant abgelegter Daten erkannt und behoben werden können und die eine für die Nutzer transparente Arbeit mit zentral bezogenen Wikidata-Daten ermöglichen, wo immer sie dann (sobald hoffentlich ein konsistenter Zustand hergestellt ist) nur noch dort gespeichert werden. Bevor ein Datenelement, das redundant gespeichert war, nur noch aus Wikidata bezogen wird, dann sollte das zum Zeitpunkt der Umstellung keinerlei Auswirkung auf die dargestellten Inhalte in der Wikipedi haben; und wenn dann ein Vandale Daten in Wikidata ändert, die Konsequenzen für die Wikipedia-Darstellung haben, sollte das wie eine Änderung am Artikel selbst auf der Beobachtungsliste erscheinen und von dort aus wie eine Artikeländerung gegebenenfalls zurücksetzbar sein. Umgekehrt könnten Unsinnsmeldungen über neue Sprachverlinkungen entfallen (oder zumindest abschaltbar sein).

Dann müsste man sich keine Gedanken über eventuell dort unbemerkten Vandalismus in Wikidata machen, weil derjenige Vandalismus, der umseitig gefürchtet wird, genauso hier aufschlagen würde wie Wikipedia-Vandalismus. (Man könnte das sogar in die gesichteten Versionen einbeziehen, wenn man denn wollte.) Ich vermute allerdings, dass dafür umfangreiche technische Änderungen notwendig wären, die man an zuständiger Stelle bekanntlich lieber hintenanstellt. --77.3.167.180 22:20, 11. Jun. 2020 (CEST)Beantworten

Ich weiß nicht, was Du unter "Datenintegrität" verstehst. Das Problem an den hier vorliegenden Daten ist doch, dass sie nicht einfach "richtig" oder "falsch" sind. In diesem Fall handelt es sich um ID-Nummern von Personen in einer Normdatei. "Falsche" Daten sind das dann, wenn die ID auf eine falsche Person deutet. Wann sind sie aber "richtig"? Sind sie schon dann "richtig", wenn unter einer ID auch die "richtige" Person auftaucht, aber auch andere Personen, oder sind sie dann "falsch"? Insbesondere eine ID wie die von VIAF ist zudem eine komplexe Angelegenheit, nämlich eine Verknüpfung von Normdaten zu einer "virtuellen" Normdatei. Wann ist die VIAF "richtig"? Müssen dazu alle verknüpften Normdaten "richtig" sein? Was ist, wenn es mehrere VIAF-IDs zu einer Person gibt, von denen die eine auf die GND, die andere auf LCAuth referiert, von denen in beiden Fällen nur Teile korrekt und andere Teile falsch sind?
Was ich von einer Datenbank wie Wikidata erwarten würde, ist nicht, dass sie die Widersprüche zwischen den Daten "behebt", sondern dass sie sie benennt und wenn möglich aufklärt. Wikidata sollte sich zur Aufgabe machen, gerade auch die Inkonsistenzen der Datenbanken zu dokumentieren. Die Frage, was davon dann in einem Wikipedia-Artikel stehen soll, ist wieder eine andere.
Im Falle der Normdaten hat Wikidata weniger das Problem, dass es sie schlecht oder falsch erfasst. Sondern zwei andere: Erstens erfasst es sie unkritisch (etwa per Bot). Zweitens erfasst es sie unzureichend. Im Fall der GND übernimmt es nicht die Angaben zum GND-Typ, im Fall der VIAF übernimmt es nicht die "Remarks". Es werden durch unkritische Erfassung neue Inkonsistenzen geschaffen und die bereits (oft aus WP) bekannten Inkonsistenzen werden in WD nicht dokumentiert. Was auf diese Weise entsteht, kann man wohl nicht als "Datenintegrität" bezeichnen.--Mautpreller (Diskussion) 22:47, 11. Jun. 2020 (CEST)Beantworten
Am obigen Beispiel: Die VIAF-ID-Nummern von Henry Bauër in Wikidata und Wikipedia sind identisch und insofern richtig, als die Schriften dieses Autors unter dieser ID verzeichnet sind. In de.wp steht jedoch darüber hinaus, dass unter derselben ID auch Namen, Lebensdaten und Werke anderer Personen verzeichnet sind, diese Angabe ist also "richtiger". In Wikidata lässt sich dieses Faktum nicht stabil verzeichnen. Es fehlen die Aussagen und insbesondere Qualifikatoren, die das erfassen könnten. Insbesondere wird dort nicht verzeichnet, welche Datenbanken die VIAF verknüpft. Das wäre aber wichtig, denn einige dieser Datenbanken beziehen sich auf andere Personen mit anderen Lebensdaten und anderen Werken. Durch Botläufe werden diese falschen Verknüpfungen aber von der VIAF-ID ausgehend immer wieder repliziert. Es gibt kein sicheres Mittel, das zu verhindern. Insbesondere fehlen die "Stoppschilder", die sagen: Halt, es ist aber doch bekannt, dass diese Verknüpfungen nicht (alle) korrekt sind. Für jede Form von "Datenintegrität" wäre es doch entscheidend, dass solche Stoppschilder dokumentiert und beachtet werden. Das funktioniert aber nicht und scheint auch keine hohe Priorität zu haben. So muss befürchtet werden, dass ein bereits erreichter "korrekterer" Datenbestand immer wieder überschrieben wird. Bisher können wir nur raten, wie sich das verhindern lässt.--Mautpreller (Diskussion) 23:07, 11. Jun. 2020 (CEST)Beantworten
Unfähige Bot-Programmierer sind ein anderes Problem. :)
Deine Ausführungen klingen für mich eher so, als ob Normdaten grundsätzlich unnütz seien. Was nützen Normdaten, wenn dieselbe Person mehr als eine ID haben kann? Oder besser: Was nützen Normdaten, wenn dieselbe Person mehr als eine ID haben kann, ohne dass der Umstand, dass es sich um dieselbe Person handelt, ebenfalls aus den Daten ersichtlich ist? Die Frage, was „richtige“ Normdaten sind, kann ich nicht beantworten, aber wenn es kein klares Kriterium für Datenrichtigkeit gibt, dann hat man mit den Daten ein ernstes Problem. Dann werden sie nämlich ganz schnell arbiträr, und das ist nicht gut.
Unter Datenintegrität verstehe ich übrigens, dass die von Daten repräsentierte Information keine Widersprüche enthält: dass also insbesondere keine Daten, die laut Datenmodell identisch sein müssten, es nicht sind. Datenintegrität hat aber noch andere Aspekte, zum Beispiel kann Hans X nicht Vater von Peter Y sein, wenn Gustav Z sowohl Sohn von Peter Y als auch Vater von Hans X ist. (Es soll zwar angeblich irgendwelche rechtlichen Fummeleien geben, mit denen man vor dem Gesetz sein eigener Großvater werden kann, aber zumindest biologisch sollte Abstammung antisymmetrisch sein.) Und ja, derartige Eigenschaften von Relationen kann und sollte man auf Integrität überprüfen (das wäre doch mal eine sinnvolle Aufgabe für Wikidata-Bots).
Wenn das Wikidata-Datenmodell unzureichend ist, sollte es übrigens verbessert werden. Das ist selbstverständlich Vorraussetzung dafür, dass Daten irgendwann von dort bezogen werden können. --77.3.167.180 00:05, 12. Jun. 2020 (CEST)Beantworten
Ich bin Anwender von Daten und kein Fachmann für die Modellierung von Daten, deshalb kann ich da nur vom Standpunkt des Anwenders was dazu sagen, in diesem Fall desjenigen, der wissen will, wo es Informationen über Personen zu finden gibt (wobei die Normdaten sich nicht auf Personen beschränken, aber das ist für mich der häufigste Anwendungsfall). Von diesem Standpunkt sind Normdaten für mich dann am nützlichsten, wenn sie vollständig und eindeutig die Lebensdaten und Werkbestände einer Person erschließen. Das kann nur erfüllt werden, wenn eine ID nur genau eine Person erfasst und eine Person nur genau eine ID hat. Bloß ist das in vielen Fällen gar nicht erfüllbar. Man weiß einfach oft nicht über die genaue Identität der Person Bescheid, und das Wissen ändert sich zudem im Zeitverlauf (und nicht immer hin zu "sicherem Wissen", sondern manchmal auch zu "unsicherem Wissen", d.h. eine früher angenommene Identität muss aufgrund neuer Erkenntnisse angezweifelt werden). Normdaten sind daher für mich dann nützlich, wenn sie diese Situation unvollständiger Information abbilden und mit der Entwicklung des Wissens "mitgehen" können. Die VIAF-ID ist ein Spezialfall, da sie sozusagen eine gemeinsame ID für auf unterschiedliche Weise erfasste Normdaten bereitstellt (sozusagen Meta-Normdaten). Manchmal ist so eine VIAF-ID für meine Suche nützlich, weil sie Hinweise darauf gibt, wo man noch suchen könnte; manchmal ist sie geradezu unnütz, weil sie aufgrund falscher Verknüpfungen in die Irre leitet und zugleich die richtigen Spuren verdunkelt (weil sie die richtigen Verknüpfungen nicht herstellt und auch keinen Hinweis darauf gibt).
Was mich an Wikidata stört, ist, dass diese Situation nicht "mitgedacht" wird. Die Unvollständigkeit und Widersprüchlichkeit der vorliegenden (externen) Information spiegelt sich zum Teil durchaus in den diversen Datenbanken und Normdatensätzen, genau diese Indikatoren werden aber von Wikidata eben nicht dokumentiert. Wikidata tut so, als wäre der Eins-zu-eins-Idealzustand schon erreicht oder stünde jedenfalls vor der Tür. Das ist fern jeder Realität. Und was mich dann noch mehr stört, ist, wenn diese Eindeutigkeitsfiktion dann zurückschlägt auf die externen Quellen (wie zum Beispiel den Wikipedia-Artikel), wenn dann also eine bekannte Situation unvollständiger Information ersetzt wird durch eine eindeutig falsche Vorspiegelung vollständiger, gesicherter Information.--Mautpreller (Diskussion) 10:01, 12. Jun. 2020 (CEST)Beantworten
Man könnte nun hier lange über Wikidata diskutieren, ich denke aber, dass es nicht der richtige Ort ist. Nur noch zwei Anmerkungen: erstens, ein Problem ist, dass Wikidata sehr viel zur Befüllung von Infoboxen etc. genutzt wird. Dabei stören Indikatoren des Zweifels und der Unvollständigkeit der Information. Das ist meiner Vermutung nach der Grund, warum sie nicht erfasst werden, mit dem Ergebnis mangelnder Datenqualität. Zweitens, ein wichtiger Indikator, der mir nützt, um VIAF-Daten zu bewerten, sind dokumentierte und bibliografisch nachgewiesene Werke. Die sind aber ganz schwer in Wikidata einzubringen. Man muss jweils neue Datensätze mit den Werken anlegen (auch wenn sie außerordentlich dünn sind), es ist nicht möglich, sie einfach als Text einzugeben (oder zum Beispiel durch Verknüpfung mit einem Datensatz in einer Nationalbibliothek, was wohl noch besser wäre).
Ich weiß zum Beispiel nicht, warum der VIAF-Datensatz zu Bauër die Verknüpfung zu falschen LCAuth-Normdaten herstellt, obwohl schon die Lebensdaten nicht übereinstimmen (das macht auf mich tatsächlich einen "arbiträren" Eindruck). Es gibt nämlich auch mindestens einen anderen LCAuth-Eintrag, der zwar auch falsche Lebensdaten nennt, aber dennoch besser passt, weil mindestens ein dort genanntes Werk eindeutig der richtigen Person zugeordnet werden kann, nämlich diesen. Der führt aber zu einer anderen VIAF-ID. Ich habe ehrlich keine Ahnung, wie diese doch ziemlich sicher relevanten Erkenntnisse nun in Wikidata umgesetzt werden könnten. Es geht noch nicht einmal um "Entscheidung", sondern zunächst mal darum, diese Sachen dort, wo sie doch wohl hingehören, zu dokumentieren.--Mautpreller (Diskussion) 10:41, 12. Jun. 2020 (CEST)Beantworten
die IP kennt sich aus, da kann ich (fast) alles unterschreiben. Die Frage ist, wie kriegen wir das Kind geschaukelt. ;-) --Hannes 24 (Diskussion) 20:33, 12. Jun. 2020 (CEST)Beantworten
Weiß nicht. Ich hab ja ein bisschen auf WD editiert, aber insbesondere die Kommunikation ist dort arg gewöhnungsbedürftig. Ich fürchte eben auch, dass das Projekt sich bereits konsolidiert hat als Vorlagenlieferant für den Artikelnamensraum der Wikipedien (und vielleicht auch noch anderer Seiten). Dabei wäre es doch viel dringender, die Probleme und Widersprüche der Datenquellen zu dokumentieren, damit man mit den Angaben auch was anfangen kann. Wenn jemand eine Möglichkeit sieht, dieses Vorhaben auf Wikidata zu formulieren und voranzubringen, würde ich mitmachen. Das in dieser Umfrage angestrebte Vorhaben würde ich wahrscheinlich trotzdem ablehnen, aber es wäre immerhin ein Gewinn, wenn man aus Wikidata was machen könnte. Bloß sehe ich das nicht optimistisch.--Mautpreller (Diskussion) 20:49, 12. Jun. 2020 (CEST)Beantworten
Wenn die Zuordnung der Normdaten zu den Artikelgegenständen nicht eineindeutig ist, dann ist das ein Problem. Dann stellt sich nämlich auch die Frage, ob wir überhaupt Normdaten angeben sollten. --Morten Haan 🏄 Wikipedia ist für Leser da 🧉 Übersichtliche Artikelkriterien 23:30, 12. Jun. 2020 (CEST)Beantworten
Ja klar ist das ein Problem, aber eben ein unvermeidbares. Ziel muss natürlich eine eineindeutige Zuordnung sein, aber dieses Ziel ist eben in vielen Fällen mindestens derzeit nicht zu erreichen. Das liegt nicht an Wikidata, sondern an den Normdaten. Das Problem von Wikidata ist, dass es diesen Zustand verschleiert und damit nicht hilft, einer solchen Zuordnung näher zu kommen, sondern diesen Versuch sogar behindert.--Mautpreller (Diskussion) 10:23, 13. Jun. 2020 (CEST)Beantworten

Fälle wie dieser

[Quelltext bearbeiten]

Mouzens (Dordogne): Es gibt zwei, wie man in Mouzens nachgucken kann. Wikidata ordnet die VIAF:234361441 zu und an dieser VIAF hängt als einige Bibliothek die DNB und die hat dafür den Datensatz GND 4846019-9. Das kann Mouzens (Dordogne) sein oder auch Mouzens (Tarn).

Okay, die VIAF kann ich bei Wikidata als "Missbilligter Rang" kennzeichnen. Auch die GND kann ich eintragen und missbilligen. Aber was gebe ich als "Grund der Zurückweisung" an? Es kann richtig sein, kann aber auch falsch sein. Ich kann das nicht entscheiden.

Nur das ist ja nicht das Ende. Ich müsste alle "Mouzens" bei Wikidata suchen und dort das ebenfalls diesen Eintrag machen. Eigentlich müsste man dieses Pärchen selbst als nicht zuordenbar kennzeichnen, ganz ohne Objekt. Eben um zukünftige unklare und damit potentiell fehlerhafte Zuordnungen zu vermeiden.

Ähnliches Problem bei Achères (Cher), Blackburn, Chagny (Saône-et-Loire), Falaise (Ardennes), Jinchang (Suzhou), La Couronne (Bouches-du-Rhône), Lavaur (Tarn), Mesmont (Ardennes) oder der umgekehrte Fall: GND 4042929-5 gehört zu welchem (der beiden unteren) Einträge aus Oberhessen (dorthin verlinkt der GND-Datensatz). Die 8 Fälle sollten als Beispiele genügen, man kann jeweils von deWP nach Wikidata, von dort zur VIAF und dann weiter zum uneindeutigen GND-Datensatz navigieren. Und in der deWP kann man die Klammern wegmachen und man findet die Namensvetter. Die Problematik hier sollte somit ein jeder nachvollziehen können. Für weitere Beispiele einfach nach Benutzer:Wurgl/Fehler_GND/Kommentiert gehen und nach dem Wort "welches" suchen, ein paar der bisher 22 dieser Problemfälle waren lösbar. --Wurgl (Diskussion) 08:14, 13. Jun. 2020 (CEST)Beantworten

Zur Auswertung

[Quelltext bearbeiten]

Es ist vielleicht nicht so hilfreich, wenn die Umfrage vom Ersteller ausgewertet wird. Da ich mich lediglich mit ein paar eher technischen Kommentaren auf dieser Diskussionsseite zurückgehalten habe und umseitig nicht "abgestimmt" habe, hier ein paar Gedanken:

  • Diese Umfrage hatte lediglich ein Ziel zum Thema, ohne die zahlreichen zu berücksichtigenden Probleme bei der Umsetzung zu adressieren. Das darf man natürlich so wie geschehen fragen, aber das reicht unabhängig vom Ausgang der Umfrage längst nicht für eine Implementierung.
  • Im Ergebnis ist der Nutzung von Wikidata in dieser Vorlage von einer leichten Mehrzeit zugestimmt worden, wobei in beide Richtungen starke Abweichungen vom mittleren Ausgang festzustellen sind. Nebenbei: das ganze war sicherlich auch ein wenig ein grundsätzliches Stimmungsbild zur Wikidata-Nutzung in der deutschsprachigen Wikipedia; aus meiner Sicht wäre es ziemlich schwer gewesen, irgendeine Tendenz vorab vorherzusagen. Angesichts der Arbeit, die in die hier vorgeschlagene Umstellung zu stecken wäre, ist es in meinen Augen sehr sinnvoll, vorab die grundsätzliche Haltung dazu abzufragen.
  • Der Ausgang darf nun tatsächlich ermutigen, das ganze einmal etwas konkreter zu planen. Code vorzubereiten und zu testen (aber nicht in die Vorlage einzusetzen), und natürlich auch die zahlreichen ungeklärten Fragen abklopfen:
    • Wie mit den schwierigeren Fällen umgehen, wenn kein 1:1-Mapping vorzufinden ist, oder in der Normdatei Einträge vermischt sind?
    • Wirklich alle Normdaten umziehen, oder GND aufgrund ihrer Sonderstellung ggf. erstmal hier belassen und später neu bewerten?
    • Lokale Daten entfernen oder nicht?
    • Können Normdaten ggf. in der Wikipedia-Benutzeroberfläche bei Wikidata eingetragen werden?
    • Was fehlt bei Wikidata für eine effiziente Normdatenwartung? Was stört dort bei dem Vorgang und wäre zu verbessern?
    • Vandalismus bei Wikidata: ist das ein Problem, und wenn ja wie sehr? Was kann man machen?
    • Welche Hilfeseiten müssen erneuert oder verbessert werden?
    • … (sicherlich noch mehr)
  • Als Nebenbemerkung: wenn die vorwiegend manuelle lokale Wartung wegfiele, stellt sich auch die Frage nach der Auswahl der Normdateien erneut. Zurzeit werden GND + VIAF + aus eher historischen Gründen LoC und NDL angezeigt; das hat im Wesentlichen Gründe, die in den limitierten Wartungskapazitäten durch die manuelle Wartung liegen. Fiele die weg, so kämen grundsätzlich viele andere Normdaten in Frage, die bei Wikidata längst hinterlegt sind, und zum Teil hier zurzeit eher durch Datenbanklink-Vorlagen abgedeckt werden. Dabei wird übrigens längst mit verschiedenen Varianten des Wikidata-Datenbezugs oder -Abgleichs gearbeitet.
  • Wenn das alles geklärt ist, wäre wohl angesichts der Einbindung der Normdaten-Vorlage in hunderttausenden Seiten ein Meinungsbild mit einem ganz konkreten Umsetzungsvorschlag angemessen, ggf. mit kleineren Abstimmvarianten sofern das sinnvoll und nötig erscheint. Ginge das durch, wäre der Weg für eine tatsächliche Umstellung frei – sonst halt nicht.

Findet das soweit grob Anklang? —MisterSynergy (Diskussion) 13:14, 13. Jun. 2020 (CEST)Beantworten

Das von dir angesprochene Kernproblem ist, dass wir vermutlich großflächig aneinander vorbeidiskutiert haben.
  • Ist es als Fernziel wünschenswert, eine zentrale und korrekte Normdatenverwaltung in Wikidata zu haben? Das hätte ich sofort unterschrieben, dafür braucht man keine Umfrage.
  • Ist es derzeit realistisch, ganz auf Wikidata umzusteigen (oder auch nur so Normdaten subsidiär einzublenden), ohne empfindlich an Qualität einzubüßen? Soweit ich sehe, beantwortet die Mehrheit jener, die sowohl die Situation in der deutschen Wikipedia als auch in Wikidata im speziellen Bereich der Normdaten überblicken können, klar negativ. Das liegt sicher auch an fehlenden Tools, aber in erster Linie an nur schwach vorhandenem Problembewusstsein in der Wikidata-Community.
Etwas polemisch formuliert kann man den Großteil der Pro-Argumente (polemisch) zusammenfassen mit „Wie schwer kann das bitte sein?“ und „Es wäre doch aber wünschenswert, Artikel und Normdaten sauber zu trennen, und irgendwann wird Wikidata schon auf wundersame Weise besser werden.“ Die Contra-Argumente sind (abgesehen vom Spezialproblem, dass manche Redundanz auch in Zukunft vorhalten wollen, was man im Detail diskutieren müsste) meist vom Typus „Doch die Verhältnisse, sie sind nicht so“, manchmal – das muss ich durchaus selbstkritisch sagen – vielleicht auch etwas zu negativ Wikidata gegenüber. --emu (Diskussion) 13:25, 13. Jun. 2020 (CEST)Beantworten
Die Umfrage hat tatsächlich lediglich die Grundeinstellung der teilnehmenden Benutzer abgefragt. Es wurde niemandem wirklich geholfen, sich ein Bild von der Sache zu machen, oder die eigene Meinung weiterzuentwickeln oder gar umzuschwenken auf eine andere Position. So kommt es, dass auf beiden Seiten sowohl hilfreiche als auch eher absurde Kommentare verfasst wurden – was in einer Umfrage wie dieser völlig okay ist.
Allerdings ist bisher nicht erwiesen, dass eine Wikidata-Nutzung in dieser Vorlage zwingend funktioniert oder eben zwingend nicht funktioniert. Das wäre nur anhand eines konkreten Plans abzuschätzen, wobei selbst dann längst nicht alle Benutzer ihre bisher oft gefestigte Meinung hinterfragen werden. Wenn der konkrete Plan dann im Meinungsbild scheitert, dann gibts das hier halt nicht. —MisterSynergy (Diskussion) 13:39, 13. Jun. 2020 (CEST)Beantworten
Ich hätte das Ziel einer zentralen Normdatenwartung nicht unterschrieben, weil ich die Probleme bei Wikidata für nicht ausräumbar halte und Redundanz hier als unabdingbar ansehe. Das ändert aber nichts daran, dass die Umfrage einiges an neuen Einsichten, Argumenten und Techniken gebracht hat, auch speziell für mich. das kann man ihr als Verdienst anrechnen, wenn es überhaupt wahrgenommen wird (woran ich gewisse Zweifel habe, aber mal sehen). Sicher sinnvoll ist es, Mister Synergys Fragen im Detail zu diskutieren. Hinzufügen würde ich die Prüfung der Bot-Aktivität auf Wikidata, die wechselseitigen Abhängigkeiten zwischen Wikidata und VIAF und generell die Probleme der unzureichenden Erfassung von Inkonsistenzen innerhalb und zwischen Normdateien bei Wikidata. Was dabei rauskommt, ist mir naturgemäß noch nicht klar, das sind aber auf jeden Fall Fragen, deren Klärung die Normdatenwartung voranbringen würde, unabhängig von der Entscheidung, wo die Daten gepflegt werden.--Mautpreller (Diskussion) 13:40, 13. Jun. 2020 (CEST)Beantworten
Zur Info: Die Aktivitäten (nicht nur Bots, sondern alle User) bezüglich VIAF, LCCN und GND (bzw. P227, P214, P244) werte ich anhand des Dumps von Anfang Mai aus. Der Dump umfasst grob geschätzt dekomprimierte 54 TB (kein Tippfehler, siehe Abschnitt "All pages with complete page edit history (.bz2)" https://dumps.wikimedia.org/wikidatawiki/20200501/) . Das Ding läuft seit letzten Sonntag und ist zur Hälfte durch (570 von 1000 Dumpfiles sind vor-analysiert). Danach kann ich mir ein echtes Bild von den Aktivitäten machen. --Wurgl (Diskussion) 18:02, 13. Jun. 2020 (CEST)Beantworten
Ich finde es gut zusammengefasst, MisterSynergy, danke dafür. Ziko (Diskussion) 17:25, 13. Jun. 2020 (CEST)Beantworten

Ja dann, lass uns mal die "zahlreichen ungeklärten Fragen abklopfen". Du fragst: "Was fehlt bei Wikidata für eine effiziente Normdatenwartung? Was stört dort bei dem Vorgang und wäre zu verbessern?" Mir scheint, dort fehlt vor allem eine Kontrolle insbesondere der Entwicklung der VIAF-Cluster in regelmäßigen Zeitabständen. Es fehlt außerdem die Möglichkeit, falsche Verlinkungen exakt zu benennen und zu dokumentieren. Störend wirkt dabei ein mangelndes Qualitäts- und Problembewusstsein der Wikidata-Community. Dies drückt sich vor allem in bot- oder scriptgesteuerten Edits aus, die bereits nachgewiesene und korrigierte Fehler immer wieder neu in den Datenbestand einschleppen. Die Folge ist eine Instabilität der Datensätze. Schlicht gesagt ist es nicht möglich sicherzustellen, dass eine als falsch erkannte Verknüpfung auch tatsächlich stabil als solche dokumentiert wird - und darüber hinaus wird es nicht einmal bemerkt, wenn die VIAF-Datensätze sich ändern.--Mautpreller (Diskussion) 19:03, 14. Jun. 2020 (CEST)Beantworten

Was mir mal so auf die Schnelle eingefallen ist:

  • Problem 1: Wie markiert man fehlerhafte Zuordnungen um zu verhindern, dass spätere Bot- oder Script-Läufe diese Zuordnung wieder herstellen bzw. die Markierung entfernen?
    Beispiel: d:Q58849 San Marco Evangelista ist in der Wikipedia eine Ortschaft. Zugeordnet war einer der 6+1 GND-Datensätze (+1 weil bei einem Datensatz dies der Alternativname ist) die ein Bauwerk/eine Kirche beschreiben. Zugeordnet in 2015 durch einen Bot. Wer garantiert, dass nicht dieser oder ein anderer Bot fröhlich einen anderen der 6+1 GND-Datensätze zuordnet?
  • Problem 2: Wie dröselt man vermischte VIAF-Cluster auseinander?
    Beispiel: d:Q1125847 Mautpreller#s Henry Bauër Man beachte die Versionsgeschichte, das ist ein raus und rein.
  • Problem 3: Wenn es mehrere VIAF-Cluster gibt, wie markiert man die für die Sprachversion relevanten? Oder sollen alle angezeigt werden?
    Beispiel: d:Q65968#P214 Dem Artikel Habsburg 5 VIAF-Cluster sind zugeordnet. Okay, irgendwann im Jahre Schnee werden die mal zu einem Cluster zusammengezogen – oder auch nicht.
  • Problem 4: Wie kann man Zuordnungen markieren, die einer von uns hier manuell zugeordnet und geprüft hat?
    Hintergrund der Frage ist 1.) geht die Arbeit der Normdatenwarter einfach den Bach runter? (sowas steigert das Frustpotential enorm) und 2.) wie kann man Wartungslisten von fraglichen Zuordnungen, wie eben die "San Marco Evangelista" erstellen?

Und dann sind diese Kleinigkeiten wie: In der deWP lösch ich einfach eine falsch zugeordnete ID, schreib was in den Änderungskommentar hinein und/oder verwende das Feld Kommentar. Recht einfach. Bei Wikidata reicht löschen nicht wegen Problem 1, da muss der Rang geändert werden, dann ein Grund der Zurückweisung und eventuell sogar ein ganz neues Datenobjekt das etwas Recherche erfordert und dann müssen die falschen Zuordnungen verschoben werden. Was mehr Aufwand ist, kann sich jeder denken. Noch dazu laden die Wikidata-Datensätze manchmal nicht vollständig, die Knöppe bearbeiten erscheinen manchmal (wenn auch recht selten) nicht. Und obendrauf hüpft die Seite dann. Was recht nervig ist, wenn man im gleichen Browserfenster einen Link aufruft und dann auf zurück geht, da muss man dann wieder an die Stelle scrollen. Nervig. Bei Mini-Datensätzen ist das schnuppe, aber such mal die Normdatensätze bei Monstern wie d:Q27350225 (okay, der Datensatz hat keine, aber zum Demonstrieren der Ladezeit und zum Demonstrieren des Suchens ist er gut). --Wurgl (Diskussion) 20:09, 14. Jun. 2020 (CEST)Beantworten

Umsetzung gerne bei neuen Biografien

[Quelltext bearbeiten]

Gerne kann das jemand bei folgenden neuen Biografien umsetzen, bei denen ich ungerne händisch eingepflegte Normdaten sehen würde, weil Wikidata eigentlich ordentlich gepflegt ist:

Also: Ran an die Automatik. --IgorCalzone1 (Diskussion) 20:10, 17. Jun. 2020 (CEST)Beantworten

LOL "ordentlich gepflegt" LOL! Einer hat die schon händisch eingepflegt. Einer hat eine VIAF-ID in Wikidata, die VIAF kennt LCCN und GND. Fertig. Bei zwei gibt es Namensvetter auf vergangenen Jahrhunderten, da bin ich gespannt, was die Bots und Scripte so machen. Und einer hat zwar eine GND, aber bei Wikdata ist nix. --Wurgl (Diskussion) 20:55, 17. Jun. 2020 (CEST)Beantworten

Auch bei Petr Jákl würde ich gerne die Umsetzung des Community-Wunsches sehen. In Wikidata findet sich alles, was sich auch in den händisch eingeführten Normdaten findet.--IgorCalzone1 (Diskussion) 09:27, 19. Jun. 2020 (CEST)Beantworten

Na ja, gestern aber wäre Henri Gilardoni durch die falsche VIAF:8152743021627732946 beglückt worden, welches ich aufgrund der händischen Prüfung verhindern konnte... --Silke (Diskussion) 09:36, 19. Jun. 2020 (CEST)Beantworten

Auch bei Tomáš Dalecký würde ich gerne die Umsetzung des Community-Wunsches sehen. In Wikidata findet sich alles, was sich auch in den händisch eingeführten Normdaten findet. --IgorCalzone1 (Diskussion) 09:50, 19. Jun. 2020 (CEST)Beantworten

Echt wahr, da steht was bei Wikidata? https://www.wikidata.org/w/index.php?title=Q66310142&oldid=1196056723 Also zum Zeitpunkt, bevor du den Artikel erstellt hast? Hast du das jetzt absichtlich ignoriert oder einfach mal übersehen? --Wurgl (Diskussion) 10:43, 19. Jun. 2020 (CEST)Beantworten