assessments-stopheim-statistical-brend-1

Stopeheim -Bewertungen: Statistische Überprüfung

Hallo zusammen! Ich wollte statistisch gesehen statistisch die Stopgamovs Noten mit einigen Big Data vergleichen, in denen sie sich beziehen? Gibt es Interdependenz?? Ist es möglich, dies überhaupt zu tun??

Ich ziehe Ihnen eine kleine Studie auf, die keine hohen Ziele und Ziele festgelegt hat, sondern hauptsächlich auf Witze durchgeführt wurde.

Datenvorbereitung oder wie die Affenarbeit nicht erledigt wird

Zuerst müssen Sie eine Basis von Spielen zusammenstellen, mit denen wir weiter Spaß haben werden.

Informationen von der Seite mit der Verteilung aller Bewertungen für Klassen müssen in eine langweilige Tischansicht gebracht werden. Insgesamt 73 Seiten, durchschnittlich 30 Spiele jeweils – das sind 2 190 Spiele. Nehmen wir zwei Minuten an, um die Namen manuell und ruhen sich aus – das sind 73 Stunden!

Etwas anderes wird benötigt. Am Ende jedes Titels mit einer Überprüfung ist es “Rezension” geschrieben, die die Idee veranlasst hat – Sie können den Seitencode öffnen, ihn in das Exel kopieren (es sieht schrecklich aus, aber ich kann nichts anderes tun) und filtern die Zeilen, in denen dies die gleiche “Bewertung” ist, die gleiche “Überprüfung” ist. Gesagt, getan. Einige erbärmliche 40 Minuten später erschien die Basis der Stopgamov -Bewertungen.

Jetzt müssen Sie herausfinden, was Sie mit den Klassen vergleichen sollen. In Reddte wurde ein Beitrag gefunden, in dem jemand vor dem Schließen eine große Datei mit der Bewertungsdatenbank von Game Rankings veröffentlicht hat (die Website selbst ist nun ein Streik auf Metacritic). Die Datei stammt aus Dezember 2019., Eineinhalb Jahre müssen also vermisst werden.

Infolgedessen wurden 1.287 Spiele, die in den Jahren 2010–2019 veröffentlicht wurden.

Visualisierung der empfangenen Daten. 1. Verteilung von Punkten zur Bewertung von SG. Die Abhängigkeit ist sichtbar, und der mittlere (Read: Durchschnittliche) Score wächst für jede Bewertung. 2. Verteilung von Spielen in Punkten und Schätzungen. Kritiker unterstützen sich eindeutig, die meisten Bewertungen zwischen 70 und 80 Punkten. 3. Trockenstatistik. 4. Nur ein Bildschirm darüber, wie die Basis aussieht.

Visualisierung der empfangenen Daten. 1. Verteilung von Punkten zur Bewertung von SG. Die Abhängigkeit ist sichtbar, und der mittlere (Read: Durchschnittliche) Score wächst für jede Bewertung. 2. Verteilung von Spielen in Punkten und Schätzungen. Kritiker unterstützen sich eindeutig, die meisten Bewertungen zwischen 70 und 80 Punkten. 3. Trockenstatistik. 4. Nur ein Bildschirm darüber, wie die Basis aussieht.

Visualisierung der empfangenen Daten. 1. Verteilung von Punkten zur Bewertung von SG. Die Abhängigkeit ist sichtbar, und der mittlere (Read: Durchschnittliche) Score wächst für jede Bewertung. 2. Verteilung von Spielen in Punkten und Schätzungen. Kritiker unterstützen sich eindeutig, die meisten Bewertungen zwischen 70 und 80 Punkten. 3. Trockenstatistik. 4. Nur ein Bildschirm darüber, wie die Basis aussieht.

Visualisierung der empfangenen Daten. 1. Verteilung von Punkten zur Bewertung von SG. Die Abhängigkeit ist sichtbar, und der mittlere (Read: Durchschnittliche) Score wächst für jede Bewertung. 2. Verteilung von Spielen in Punkten und Schätzungen. Kritiker unterstützen sich eindeutig, die meisten Bewertungen zwischen 70 und 80 Punkten. 3. Trockenstatistik. 4. Nur ein Bildschirm darüber, wie die Basis aussieht.

Modellierung (nicht 3D, aber statistisch)

Für einen wissenschaftlich basierten Ansatz zur Analyse von Beziehungen verwenden wir die Regression der Multinomie -Logistik.

Die Regressionsanalyse untersucht den statistischen Zusammenhang zwischen einer abhängigen Variablen und (einer oder mehreren) unabhängig und zeigt das Vorhandensein oder Fehlen von Kommunikation, ihre Stärke und ermöglicht es Ihnen, die Vorhersage einer der Variablen zu machen, wobei die anderen kennt. Nachdem Sie beispielsweise das Verhältnis des Zeitalters des Spielers und der Uhr, die hinter dem Compacter pro Tag ausgegeben wurden, untersucht haben, können Sie die Anzahl der Stunden für jedes Alter im Allgemeinen schätzen (natürlich mit einer Reihe von Nuancen, über die wir nicht werden).

Die häufigste Regression ist linear, was die Beziehung zwischen numerischen Variablen untersucht. In unserem Fall werden die Abhängigkeit zwischen der Punktzahl des Spiels und den Bewertungen des SG, die nicht bewegt sind und nur vier Arten sein können, untersucht. Daher ist die lineare Regression für uns nicht geeignet, wir brauchen Logistik, die nicht -layerer Variablen berücksichtigt.

Wir laden unsere Tabelle in ein Statup und für eine Art Codezeilen erhalten wir eine statistisch signifikante Regression, die die Analyse der geladenen Basis durchführte und die gegenseitige Abhängigkeit zwischen den Schätzungen des SG und den Spielen des Spiels ergab. Aus Gründen der Klarheit habe ich die Modellwahrscheinlichkeit einer bestimmten Bewertung des SG abhängig von der Kritikpunkte abgeleitet.

Die Wahrscheinlichkeit jeder SG -Bewertung für jeden Kritiker Score. Zum Beispiel ist der blaue Sektor eine Bewertung von “Müll”. Mit dem Wachstum des Spielpunkts wird die Wahrscheinlichkeit eines „Mülls“ verringert, da die Qualität des Spiels wächst. Und das Spiel mit 72 Punkten ist höchstwahrscheinlich (die Wahrscheinlichkeit von 63%) wird “lobenswert” erhalten.

Schlussfolgerungen

Es besteht eine positive Beziehung zwischen der Bewertung von SG und der Punktzahl des Spiels – desto besser die Bewertung, desto höher ist die durchschnittliche Punktzahl (wer würde bezweifeln).

Im Allgemeinen weisen Kritiker der meisten Spiele Punkte zwischen 70 und 80 zu. In diesem Bereich beträgt die Wahrscheinlichkeit von „lobenswert“ 66%, „erstaunlich“ – 19%, „Propriknika“ – 12%. Das haben wir so viele “lobenswerte” Spiele.

Und es scheint mir das interessanteste. Wenn wir davon ausgehen, dass „Müll“ und „Passage“ im Allgemeinen „schlechte“ Spiele sind und der Rest „gut“ ist, dann ist die Wahrscheinlichkeit eines unbekannten Spiels „schlecht“ -51% („gut“ -49%). Fast perfekte Balance der Objektivität der Stopheim! Aber dann bevorzugt Stopgame die Entwickler – „schlecht“ erhält „Müll“ mit einer Wahrscheinlichkeit von 34%, und „gut“ erhält „erstaunlich“ mit 41%„erstaunlich“.

Das Wichtigste ist, dass die Einschätzungen von Stopeheim in ihrer eigenen Messe gut sind und die Meinung von Kritikern mit ihnen, fast wissenschaftlich bewiesen, übereinstimmt 🙂

Das ist vielleicht alles und alles. Vielen Dank, dass Sie bei uns sind, ich hoffe, jemand war interessiert.

Die Studie verwendete Excel, Rstudio, Power BI, Chrom und Schwarztee.

Die besten Kommentare

Der erste scheint ein Kommentar zu sein

Mit gut Unbekanntem ist es schwieriger – Sie müssen sich ansehen, warum sie nicht in die Bewertung fallen.

Also weil unbekannt)

Und Sie können Dotterian in ein paar Minuten nur fragen, Statistiken direkt aus der Datenbank zu sammeln. : D

Insgesamt 73 Seiten, durchschnittlich 30 Spiele jeweils – das sind 2 190 Spiele. Nehmen wir zwei Minuten an, um die Namen manuell und ruhen sich aus – das sind 73 Stunden!

Ich habe diesen Teil in dem Artikel die meisten Fragen aufgeworfen. Ich und so, Syak, und ein solcher Weg versuchte es mir vorzustellen, verstand aber nicht, wie man die Namen der Spiele und deren Bewertungen für eine Stunde abschreibe.

Zwei Minuten – das ist ein Spiel? O_o

(Im Moment werde ich „in die Luft einsprechen“, um das Problem der Übertragung von Informationen auf die Tabelle zu lösen

Erstens können Sie mit dem anderen zusammenarbeiten, wenn es eine Geschwindigkeitsfähigkeit (oder einen Freund damit) gibt und: Er lesen Ihnen den Namen des Spiels und eine Bewertung vor, schreiben Sie auf. In diesem Fall um ein paar Minuten, um zur Seite zu gehen. Wenn die Namen der Spiele offensichtlich vollständig aufgezeichnet werden müssen, können die Schätzungen leicht auf „Rosinen“, „PHV“, „ZH“, „MUS“ reduziert werden (aber natürlich gibt es in Pressungen eine solche Rettung). Ultimatisch – “Müll” wechseln zu “1”, “Rosinen” zu “4”.

Zweitens, wenn es keine Fähigkeiten der Fähigkeiten gibt, sowie Kenntnisse https://bets-io.de/ in Englisch auf der richtigen Ebene (um Tippfehler zu vermeiden, wenn Sie Namen einführen, weil Sie sie weiter vergleichen müssen)-Sie können einfach die Namen der Spiele kopieren. Und dann die Noten wieder reduzieren.

Aber selbst wenn Sie die Namen und Bewertungen vollständig schreiben, glaube ich nicht, dass jedes Spiel bis zu zwei Minuten dauert, um zwei Spalten “Spiel – Bewertung” auszufüllen.

PS: Und nachdem man etwas mehr Zeit verbracht hat, könnte man die Autoren immer noch aufzeichnen und Statistiken darüber durchführen, und nicht nur nach Schätzungen! (Aber ich fordere nicht zum Handeln auf. Wenn Sie verstehen, verstehe ich, dass selbst in Speedranner -Regimen eine solche Basis ein paar Stunden leicht verschlingen kann)

Wissenschaftlich bewiesen – die fünfte Bewertung ist nicht benötigt, danke, wir sind bereits perfekt objektiv!

Im Allgemeinen wäre es interessant, nicht nur die Mediane, sondern auch an einer Art von Spitzenpunkten zu untersuchen (die am meisten geschätzten Spiele, die den „Müll“ erhielten, der das „Proprodieren“ und umgekehrt mit den niedrigsten Noten, die „faul“ und „Raissins“ erhielten, erhielten, umgekehrt.
Außerdem, vielleicht eine kleine Analyse und Meinung, warum es sich herausstellen könnte

Auf dem Histogramm solcher Spiele im Bereich von 55-65 Punkten gibt es nicht so viele Punkte-die Spitze des Arrays rechts nach 70 Punkten. Lohnt es sich, eine neue Bewertung für eine kleine Anzahl von Spielen zu erhalten?? Jetzt können sie bedingt in „schlecht“ und eher „gut“ unterteilt werden, mit einem Minimum an Unsicherheit. Und wenn Sie neue Noten hinzufügen, dann, wann Sie rechtzeitig anhalten müssen?)

Aber die Beobachtung ist sehr interessant

Welche Art von Spiel habe ich bei 50 Punkten und gleichzeitig Rosinen bekommen?)

Es wäre interessant, das gesamte Beispiel beispielsweise in Google -Tabellen zu betrachten.

P.S. Für die geleistete Arbeit, mein Respekt, streichle ich gerne in Zahlen)

Es sollte auch berücksichtigt werden, dass die Bewertungen nicht auf alle Spiele gehen, sondern nur gut oder Hype. So gut unbekannt und Müllpass, was niemand braucht. Es sollte auch irgendwie beeinflussen?

Es ist einfacher, für mich nach Status zu fragen: D

Sie können die Version auch zum Drucken verwenden – sie gibt normalerweise ein ziemlich einfaches Ergebnis für die gute Parsen oder die alte gute Analyse der Website nach Skripten – wenn die Daten zusammengestellt werden müssen 🙂

Nun, wenn Sie auf den Punkt gebracht haben, haben wir angenommen. Wir bauen einen Zeitplan, in dem wir die Punkte ablegen, an denen das X das Alter entlang der X -Achse entlang der yachse – Uhr ist. Und wir sehen, dass je mehr wie das Alter ist, desto mehr Stunden (dh unsere Punkte werden durch eine solche Schlange verlängert). Cm. Ein Beispiel in einem Bild nach zufällig generierten Daten.

Eine gestrichelte Linie ist eine Gleichung der linearen Regression, dh eine Gleichung, die eine lineare Abhängigkeit auf der Grundlage einer Schlange von Punkten am besten eingestellt hat. Y ist eine Uhr, x ist Alter. Wir erhalten also, dass y = 1.8003x – 14,926, das heißt, dass Sie das Alter anstelle von X festgelegt haben, können Sie einen Nachlass über die Anzahl der Stunden erhalten.
Und dann gingen die Nuancen:

– Die Regression zeigt einfach, dass es eine Verbindung zwischen x und y gibt. Dieses Alter betrifft die Uhr? Oder vielleicht leben wir in einem parallelen Universum, und je länger Sie am Computer saßen, desto jünger (die Uhr wirkt sich auf das Alter aus). Die kausale Beziehung der Regression kann nicht beweisen

– Plötzlich hängt die Anzahl der Stunden am Computer in der Realität nicht vom Alter ab, sondern von der Klasse, in der die Schüler studiert? Dann müssen Sie eine neue Regression aufbauen und schauen, was passiert. Aus der Regression selbst kann dies nicht verstanden werden

– Alles hängt von den Daten ab, die ursprünglich in das Modell geladen wurden. Wenn Sie an einem Beispiel mit einer Uhr im Alter von 30 Jahren ersetzen, wird es herauskommen, dass eine solche Person 39 Stunden am Tag auf einem Computer verbringen wird. Offensichtlich Unsinn))) Ein solches Modell kann also für die Altersgruppen verwendet werden, zum Beispiel bis zu 18 und für andere, ein neues Modell zu erstellen (vielleicht nicht linear)

Daher wird eine reale Regression von einer Reihe von Tests, Inspektionen, Hypothesen, Wahrscheinlichkeiten, Signifikanzanalysen, vertraulichen Intervallen und anderen Lametta begleitet, die beweisen, dass diese Regression gut ist und alles berücksichtigt wird

Es ist einfacher, ein Programm zu schreiben, das selbst um die Website läuft und alle erforderlichen Informationen von dort aus in jedem bequemen Format herauszieht. Dann können Sie ruhig eine Bewertung von Benutzern, Genremen, Entwicklern hinzufügen und versuchen, Korrelationen aus diesen Daten x zu erstellen

Handgefertigt jetzt im Zeitalter der Technologie, das es stark vereinfachen kann, wenn Sie die Notwendigkeit dafür nicht vollständig entfernen, ist dies irgendwie nicht sehr x)

Nach IDDQD werden Sie ein Rinat (und die Welt fliegt mit einem blauen Bildschirm, denn Rinat ist gleich und unteilbar)

Wenn Sie sich den Zeitplan ansehen, können Sie verstehen, dass Sie nur Probleme mit Spielen im Bereich von 55-65 Punkten haben, die ungefähr fast 50%sind, sowohl „proprodieren“ und „lobenswert“, obwohl der Autor der „Proprodierung“ einer Badbewertung und „lobenswerter“ zu gut zu gut zu gut zu ordnungsgemäß ist, und „lobenswerter“ zu gut zu gut zu ordnungsgemäß zu ordnungsgemäß, und „lobenswerter“ zu gut zu gutem Zustand ist und gut zu gutem zu gut ist “, und zu gutem Umfang zu gutem Zustand zu sichern, und zu gutem zu gutem Zustand sind, zu gutem Vorgang zu tun, und zu gutem zu gutem Zustand zu sichern. Vielleicht würde nur eine Art „Lob“ X nicht beeinträchtigen)

Danke) Der Link zum Spiel ist beigefügt

Ich werde die Probe beenden und darüber nachdenken, wo ich auslegen soll

Die Barmherzigkeit stellt sich tatsächlich heraus, dass die erhaltenen Wahrscheinlichkeiten für Spiele anwendbar sind. Es wäre möglich zu sehen, was sich auf das (nicht) Hit das Spiel in der Überprüfung auswirkt (dieselben Bewertungen, Plattformen, etwas anderes), aber dies ist eine gerade Linie. Bisher scheint es, dass, wenn Sie einen Müll hinzufügen (was höchstwahrscheinlich eine niedrige Bewertung ist) genau genauer wird. Mit gut Unbekanntem ist es schwieriger – Sie müssen sich ansehen, warum sie nicht in die Bewertung fallen.

Der große Ace -Anwalt Chronicles: Review

Chicary: Eine farbenfrohe Geschichte: Rezension

Astalon: Tränen der Erde: Bewertung

Die Legende der Helden: Wege aus kaltem Stahl 4: Bewertung

Monster Hunter Rise: Rezension

Kaze und die Wildmasken: Bewertung

Atelier Ryza 2: Lost Legends & The Secret Fairy: Review

Super Mario 3D World + Bowsers Wut: Bewertung

Skul: Der Held Slayer: Rezension

03. Februar 25 +22

Cyberschatten: Bewertung

07. Januar 18 +15

Bis zum Ende: Bewertung

22. Dezember 2020. 10 +5

Die letzte Show von MR. Chardish: Bewertung

23. November 2020. 9

Tetris -Effekt: Angeschlossen: Überprüfung

19. November 2020. 7

Krontrick: Bewertung

05. November 2020. 12

Disc Room: Bewertung

22. Oktober 2020. 6 +1

Genshin Impact: Überprüfung

12. Oktober 2020. 122

05. Oktober 2020. 43 +1

Star Renegades: Bewertung

30. September 2020. 8

28. September 2020. 169 +3

13 Sentinels: Aegis Rim: Bewertung

27. September 2020. 9

Spelunky 2: Bewertung

19. September 2020. 12 +11

Ewige Hoffnung: Bewertung

10. September 2020. 7 +4

10. September 2020. 16

Dann können Sie damit umgehen, Sie können lieber eine faire Weise machen. Entweder ein Skript werfen, das diesen Vorgang automatisiert. Danach haben Sie eine leckere Liste von Spielen mit einer bestimmten Bewertung, in der Sie definitiv keine Tippfehler zulassen. Auf jeden Fall 73 – Sie haben wild gebogen)

Und welche Art von “Müll” ist es schon 74 Punkte? Dies ist bereits eine sehr starke Streuung.