Was ist maschinelles Lernen? Ihr wesentliches Business Intelligence-Glossar

Veröffentlicht: 2022-05-07

Ich habe den Frühjahrsputz immer als zu wenig, zu spät empfunden. Für mich ist der Januar der Zeitpunkt, an dem Sie bestellen, priorisieren und beginnen, die Fragen des kommenden Jahres zu beantworten. Aus diesem Grund habe ich den Januar ausgewählt, um eine Frage zu beantworten, die Sie vielleicht schon seit einiger Zeit haben: Was ist maschinelles Lernen?

Ich werde darauf antworten und auch einige andere Begriffe definieren, die Sie kennen müssen, um 2017 auf dem Laufenden zu halten. Wenn Sie daran interessiert sind, was Business-Intelligence-Software für Sie tun kann, müssen Sie zuerst diese grundlegenden Begriffe kennen .

Ich habe maschinelles Lernen an die erste Stelle gesetzt, da es einer der zehn wichtigsten strategischen Technologietrends von Gartner für 2017 ist, aber die restlichen Einträge sind alphabetisch geordnet.

Maschinelles Lernen

Vor dem maschinellen Lernen musste Computern gesagt (programmiert) werden, wie sie denken sollen. Mit maschinellem Lernen können Computer (irgendwie) für sich selbst denken.

Ich habe kürzlich mit Michael Finley, Head of Machine Learning beim BI-Softwareunternehmen AnswerRocket gesprochen , der mir bei der Ausarbeitung geholfen hat. Vor dem maschinellen Lernen lief die meiste Software „so, wie sie programmiert war: Menschen wandelten Anweisungen in Computercode um, und der Computer tat, was dieser Code ihm sagte.“ Ein sehr einfaches Beispiel wäre ein Taschenrechner: Sie fütterten den Taschenrechner mit Zahlen, sagten ihm, was er tun soll (addieren, subtrahieren), und der Taschenrechner gab Ihnen Ergebnisse. Mit maschinellem Lernen kann sich die Software jedoch anpassen. Finley fährt fort: „Software mit maschinellem Lernen macht an dem Tag, an dem sie installiert wird, nicht dasselbe wie am zehnten oder hundertsten Tag, an dem sie ausgeführt wird.“ Wenn sich die in den Computer eingespeisten Werte ändern, passt sich die Software diesen Werten an. Ein Computer mit maschinellem Lernen lernt, wie man sie einbindet.

Mit freundlicher Genehmigung von Andre Pinto und Anthill Comics

Finley charakterisiert maschinelles Lernen als Software, die mit dem Begriff „Gefällt mir“ umzugehen weiß, wie in „Ich möchte ein Lied wie das letzte hören, das ich gerade gehört habe“. Das Konzept ist für Menschen einfach, aber für Computer ist es schwierig. Finley erklärte, dass Computer gut darin sind, zu verstehen, welche Zahlen größer oder kleiner sind, und Zahlen und Namen zuzuordnen, aber sie kämpfen mit der Idee der Ähnlichkeit. Maschinelles Lernen hilft Computern zu verstehen, warum eine Sache „wie“ eine andere ist. Das Ähnlichkeitsverständnis des maschinellen Lernens ist besonders hilfreich bei der Vorhersage von Kundenwünschen.

Maschinelles Lernen steckt hinter dem nächsten Song, den Sie auf Pandora hören, oder dem Film, den Netflix vorschlägt. Die maschinellen Lernalgorithmen von Pandora und Netflix werden mit Ihren Entscheidungen (und tatsächlichen „Gefällt mir“ im Fall von Pandora) „gefüttert“ und verwenden diese, um vorherzusagen, welche ähnlichen Songs oder Shows Ihnen gefallen könnten.

Füttere diese maschinellen Lernalgorithmen mit anderen Daten, und sie werden anders reagieren. Wenn Ihre übliche Diät von Horrorfilmen plötzlich und unerklärlicherweise eine romantische Komödie enthält, reagieren die ML-Algorithmen von Netflix auf diese Daten und schlagen andere romantische Komödien oder Horrorromane vor.

Abgesehen vom sinkenden Filmgeschmack, warum ist maschinelles Lernen für KMU wichtig? Es kann ihnen helfen, mit größeren Konkurrenten zu konkurrieren. BI-Software mit maschinellem Lernen nimmt bei jeder Aktualisierung neue Zahlen auf. Sie stützen Ihre Strategie nicht auf die Zahlen eines Jahresberichts, sondern auf nahezu Echtzeitinformationen und Algorithmen, die wissen, wie sie sich an diese sich ändernden Daten anpassen können. Finley erklärt, dass die traditionelle, homogene Art und Weise, wie ein Unternehmen alles skaliert, was es tut, mit ML revolutioniert werden kann:

„Ich habe möglicherweise Best Practices festgelegt und möchte Prozesse wiederholen. Aber was wäre, wenn Sie jeden Tag Best Practices darlegen könnten, wenn Sie Informationen hätten, um sie zu ändern und Ihre Strategie jeden Tag neu zu formulieren? Dank ML haben Sie Daten, die die Strategie jeden Tag neu schreiben können, und so essen die KMUs wirklich das Mittagessen der größeren Jungs.“

Für KMU, die an einer agilen Geschäftsstrategie interessiert sind, kann maschinelles Lernen mehr als nur eine Möglichkeit sein, am Leben zu bleiben. Es könnte ein Weg sein, Teile der Marktanteile der etablierten Player zu übernehmen.

  • Ad-hoc-Analyse
  • Ad-hoc-Abfrage
  • Erweiterte Analysen
  • Künstliche Intelligenz
  • Große Daten
  • Kontextbezogene Daten
  • Datenpunkt
  • Datenqualität
  • Datenvisualisierung
  • Datenlager
  • Datenbank
  • Dashboards
  • Aufreißen
  • ETL
  • Metadaten
  • Metriken
  • Moderne BI
  • Traditionelle BI
  • SaaS/Cloud-Software
  • In Würfel schneiden
  • SQL
  • Begriffe, die Sie wissen möchten …

Ad-hoc-Analyse

Ad-hoc-Analysen sind Analysen, wenn Sie sie brauchen, auf einer Ebene, die auch Nicht-IT-Spezialisten verstehen können.

Auch wenn zugängliche Business Intelligence ein offensichtlicher Wunsch zu sein scheint, war dies nicht immer erreichbar. Lange Zeit mussten BI-Experten „Computer sprechen“ können (dh in einer Programmiersprache schreiben), um Business-Intelligence-Programme abzufragen. Wussten Sie nicht, wie man in SQL, R oder Python programmiert? Fragen Sie jemanden in der IT, der das tut. Dann warte. Und dann warten Sie, bis die Business-Intelligence-Programme funktionieren, und warten Sie dann noch etwas auf die Analyse.

Zum Glück ist BI endlich zur Ad-hoc-Analyse gereift. : Mit diesem System müssen Sie nicht auf die IT oder das langsamere Tempo der Erstellung herkömmlicher Berichte warten, um die erforderlichen Daten zu erhalten. Es macht Ihre Arbeit und ihre Arbeit einfacher und weniger stressig.

Wenn Sie kein IT-Personal haben, löst die Ad-hoc-Analyse dieses Problem. Ad-hoc-Analysen sorgen auch für eine schnellere Erkenntnisgewinnung (dies ist ein weiteres Schlagwort, das Ihnen vielleicht begegnet; es bedeutet, dass es kürzer dauert, die benötigten Informationen zu erhalten).

Ad-hoc-Abfrage

„Abfragen“ sind Fragen, die Sie möglicherweise von Ihrer Business-Intelligence-Software beantworten lassen. Sie könnten Ihre BI-Software beispielsweise nach einer alphabetischen Liste aller seit 1970 geborenen braunäugigen Kunden fragen. Sie könnten eine Anfrage genauso gut als Frage bezeichnen, aber wie oft sagen Sie in einem Gespräch „Anfrage“?

Eine Ad-hoc-Abfrage ist eine Abfrage, die Sie bei Bedarf anfordern können. Wie bei älteren Geschäftsanalysen brauchten ältere Abfragen jemanden in der IT, der sie stellte. Abfragen fanden in der Regel auch als Teil regelmäßiger Berichte statt, die Sie auf dieser monatlichen oder jährlichen Basis erhielten. Bei älterer BI-Software müssten Sie diese Abfrage in einer Programmiersprache stellen. SQL war ein langjähriger Standard in der Business Intelligence; Heutzutage sind R und Python beliebt.

Sie können Computerprogramme, einschließlich BI, als Zweige einer Bürokratie betrachten, vom DOJ bis zum HHS. Sie sind technisch dazu da, Dinge zu erreichen, aber jeder hat seine eigene Sprache und arbeitet auf seine eigene Art und Weise. Ein Programmierer ist wie ein Bürokrat, der die Sprache spricht und weiß, wie man durch jedes Programm/jede Abteilung navigiert.

Erweiterte Analysen

Dieser Begriff geht eigentlich über Business Intelligence hinaus. „Business Intelligence“ befasst sich traditionell mit der Analyse dessen, was passiert ist. Advanced Analytics geht noch weiter, sei es bei der Vorhersage zukünftiger Ereignisse oder der Analyse von Details und Faktoren, die üblicherweise nicht mit Business Intelligence in Verbindung gebracht werden. Einige Beispiele für Advanced Analytics sind Data and Text Mining , Predictive Analytics , Prognosen , Standortanalysen , Stimmungsanalysen und maschinelles Lernen.

Künstliche Intelligenz

Maschinelles Lernen ist ein Teil der KI, aber KI ist ein viel größeres Konzept. KI umfasst alles, was man „ Intelligenz von Maschinen “ nennen könnte. „Intelligenz“ im Sinne von KI bedeutet die Fähigkeit, etwas zu erledigen. Das allgemeine Verständnis von „Intelligenz“ als einfach viel Wissen ist also nicht die Art von Intelligenz, die in der KI zu finden ist.

Die „etwas“, die KI erledigen kann, sind bereits vielfältig. Beispielsweise verwendet Daisy Intelligence KI, um die Daten von Einzelhändlern zu untersuchen und dann Empfehlungen zu geben, von denen sie behaupten, dass sie „den Umsatz um 5 % oder mehr steigern können“. Wenn Sie, wie ich, genauso gerne planen wie beim DMV warten, könnte eine virtuelle Assistentin wie Amy , die Meetings basierend auf den Vorlieben der Teilnehmer planen kann, Ihre beste neue imaginäre Freundin sein.

Große Daten

Big Data sind extrem große Datensätze. Obwohl ich Stephen King normalerweise zustimme, dass „ der Weg zur Hölle mit Adverbien gepflastert ist“, ist „extrem“ gerechtfertigt. Eine kleine Datenmenge wäre beispielsweise ein kleines Buch. Ein PDF des ersten Harry-Potter-Buches ist etwa ein Megabyte (MB) groß.

Big Data wäre so etwas wie ein Petabyte an Daten. Um das Buchbeispiel fortzusetzen , beträgt alles, was seit Beginn der aufgezeichneten Geschichte geschrieben wurde, 50 Petabyte . Megakonzerne wie Google sind die Sorte, die mit Petabytes zu tun haben. Das Mesa-System von Google, das den Anzeigenverkehr von Google überwacht, verfolgt Petabytes an Daten.

Kontextbezogene Daten

Kontextdaten sind zusätzliche Daten über eine Person, einen Ort oder ein Ereignis (die in Dataspeak „Entitäten“ genannt werden). Kontextdaten helfen dabei, das Wissen eines Unternehmens über einen potenziellen Kunden abzurunden und sogar vorherzusagen, was er sich wünschen könnte.

Obwohl es sich nicht um ein Unternehmen handelt, verwendet die University of Manchester in England kontextbezogene Daten in ihrem Zulassungsverfahren, um „ einen vollständigen und abgerundeten Überblick über Ihre Leistung und Ihr Potenzial zu erhalten “. Neben dem Zulassungsformular des Schülers berücksichtigt UM Faktoren wie die Postleitzahl des Kandidaten, die Qualität der Schule, an der Sie Ihre Prüfungen abgelegt haben, und „ ob Sie länger als drei Monate betreut oder betreut wurden“.

Für ein Unternehmen können kontextbezogene Daten den Verkauf unterstützen. Ein sehr allgemeines Beispiel: Kontextdaten über einen früheren Kunden, basierend auf dem Wetter an seinem Standort, könnten den Umsatz steigern. Ein Kunde in Tuscon, Arizona kauft im Oktober eher Eis am Stiel als einer in International Falls, Minnesota .

Datenpunkt

Ein Datenpunkt ist ein einzelnes Datenfetzen. Ein Datenpunkt ist eine eigenständige Einheit oder ein Datum unter den Daten, die Sie verfolgen. Ein einzelner Datenpunkt kann alles sein, von der „Größe einer Investition “ bis hin zu einem einzelnen Klick auf eine Anzeige, die Sie bei Google gekauft haben. Im Fall von Uber ist der Standort ein wichtiger Datenpunkt – einer, der so wichtig ist, dass sie ihn sogar verfolgen, nachdem Ihre Fahrt beendet ist .

Wenn Sie mit Key Performance Indicators vertraut sind, sind Sie mit Datenpunkten vertraut. KPIs messen bestimmte Arten von Datenpunkten, wie Einnahmen oder die Zeit, die zum Abschluss eines Projekts benötigt wird.

Datenqualität

Datenqualität ist das Maß für den Nutzen Ihrer Daten. Hochwertige Daten sind sauber, organisiert und verfügbar. Wenn die Daten einer Bibliothek ihre Bücher sind, hätte eine Bibliothek mit qualitativ hochwertigen Daten die Bücher, die die Bevölkerung will und braucht, in gutem Zustand und an den richtigen Stellen.

Es gibt sechs Dimensionen der Datenqualität:

  • Vollständigkeit
  • Einzigartigkeit
  • Gültigkeit
  • Aktualität
  • Konsistenz
  • Genauigkeit

Datenvisualisierung

Eine Datenvisualisierung ist jedes Bild, Visual oder jede Grafik, die Ihre Daten anzeigt. Kreisdiagramme und Balkendiagramme wären die häufigsten Arten. Es gibt jedoch eine viel größere Auswahl an Visualisierungen. Gartners Bewertungskriterien für Business-Intelligence- und Analyseplattformen für 2016 (durch Paywall geschützt; es lohnt sich) stuft fortgeschrittenere Diagrammtypen als „bevorzugte“ Elemente ein, auf die Sie in Ihrer BI-Lösung achten sollten. Einige dieser höherwertigen, bevorzugten Diagrammtypen, nach denen Sie Ausschau halten sollten, sind:

  • Marimekko-Karten
  • X/Y-Diagramme
  • Netzwerkdiagramme
  • Pareto-Diagramme
  • Wortwolken

Datenlager

Ein Data Warehouse ist das Computersystem, in dem die Daten aus verschiedenen Datenbanken und Transaktionssystemen aufbewahrt und organisiert werden. Sie werden den Begriff oft mit „Unternehmen“ auf der Vorderseite sehen, da Sie eine große Datenmenge in Unternehmensgröße benötigen, um ein Data Warehouse zu benötigen.

Datenbank

Eine Datenbank besteht aus Daten, die so organisiert sind, dass Sie leicht auf das zugreifen können, was Sie benötigen. Schon mal bei IMDB gewesen ? Natürlich hast du. Das ist eine Datenbank: Filme, Schauspieler, Regisseure, Produzenten, alles organisiert für eine einfache Suche, wie wenn Sie in einem Sechs-Grad-Spiel von Kevin Bacon schummeln müssen .

Dashboards

Dieses Bild befindet sich vor dieser Erklärung, da es einfacher ist, zu zeigen, wie ein Dashboard aussieht.

Für eine formale Definition: Ein Dashboard ist eine visuelle Darstellung von Daten, die Sie verfolgen. Ihr BI-Programm muss unbedingt über ein Dashboard verfügen. Sie würden kein Auto ohne Armaturenbrett kaufen. Gleiches gilt für BI-Software.

Stellen Sie beim Kauf von BI-Software sicher, dass die Dashboards Ihres Programms diese beiden von Gartner empfohlenen Basiskriterien erfüllen (durch Paywall geschützt; es lohnt sich):

  • „Die Möglichkeit, Dashboards mit mindestens grundlegenden Diagrammtypen zu entwerfen, darunter Tabellen, Balkendiagramme, Liniendiagramme, Flächendiagramme und Tortendiagramme, ohne dass Optionen von Drittanbietern, Codierung oder Skripterstellung erforderlich sind.“
  • „What you see is what you get (WYSIWYG) Design“, die Fähigkeit, ein Dashboard zu entwerfen und Daten zu analysieren, ohne Programmierkenntnisse zu haben.

Aufreißen

Drilldown bezieht sich auf die Möglichkeit, eine allgemeine Information wie jährliche Verkaufszahlen zu nehmen und nach Monat, Woche oder sogar Tag aufzuschlüsseln. „Drilldown“ bedeutet, dass Sie sich vom Allgemeinen auf die Einzelheiten beschränken können, die oft den Unterschied zwischen Information und Erkenntnis ausmachen. Drilldown ist so etwas wie die Business-Intelligence-Version dieses alten Zehnerpotenzen-Films.

ETL

ETL – oder Extrahieren, Transformieren, Laden – findet zwischen der Datenerfassung und dem Platzieren dieser Daten im Data Warehouse statt.

Die Notwendigkeit des „Extrahierens“ ergibt sich aus der Tatsache, dass Daten in Datenbanken oder ERP-Software gesammelt werden, bevor sie in das Data Warehouse gelangen. Die Notwendigkeit der Transformation ergibt sich aus der Tatsache, dass diese mehreren Datenquellen oft in unterschiedlichen Formaten vorliegen und in das richtige Format umgewandelt werden müssen, um im Data Warehouse gespeichert und durchsucht zu werden. Die Notwendigkeit zum Laden ist selbsterklärend; Sie müssen sie in das Data Warehouse stellen, bevor Sie eine Datenquelle suchen und mit einer anderen vergleichen können.

Metadaten

Metadaten sind Daten über Daten. Wenn das nach Meta klingt, dann ist es … es sind Metadaten !

Aber ernsthaft.

Metadaten sind Informationen über Ihre Daten. Es gibt drei Kategorien:

  • Technisch: Die technischen Details zu Ihren Daten, wie Modelle, Format und Maße.
  • Geschäftlich: Beschreibungen der Daten in benutzerfreundlicher Sprache (d. h. einfaches Englisch)
  • Prozess: Daten, die Ihnen mitteilen, was mit welchen Datenteilen wann gemacht wurde.

Metriken

„Metrik“ ist nur ein schickes Wort für alles, was Sie messen.

Verfolgen Sie Ihre Nettogewinne? Das ist eine Metrik. Behalten Sie im Auge, wie viele Personen die BI-Software in Ihrem Unternehmen verwenden? Das ist auch eine Metrik. Behalten Sie diese Konversationsrate im Auge? Das ist auch eine Metrik. Der Trick bei Metriken besteht darin, diejenigen auszuwählen, die für Ihr Unternehmen am besten geeignet sind. Jedes Unternehmen hat unterschiedliche Anforderungen, und es ist eine gute Idee, Ihre Anforderungen und Prioritäten bei der Auswahl von Messwerten zu berücksichtigen .

Moderne BI

Der Begriff Modern Business Intelligence stammt von Gartner , der ihn folgendermaßen definiert :

Eine moderne BI-Plattform unterstützt die IT-gestützte Entwicklung von analytischen Inhalten. Es wird durch eine in sich geschlossene Architektur definiert, die es nicht-technischen Benutzern ermöglicht, das gesamte Spektrum analytischer Arbeitsabläufe autonom auszuführen, vom Datenzugriff, der Aufnahme und Vorbereitung bis hin zur interaktiven Analyse und dem kollaborativen Austausch von Erkenntnissen.

Einfach ausgedrückt: Bei moderner BI steht der Geschäftsanwender an erster Stelle. Um ein modernes BI-Programm zu verwenden, müssen Sie sich nicht oder in weitaus geringerem Maße auf jemanden aus der IT verlassen. Während herkömmliche, ältere BI-Programme so eingerichtet wurden, dass sie beispielsweise nur den IT-Leuten das Verfassen von Inhalten ermöglichten, machen es moderne BI-Programme Geschäftsanwendern leicht, selbst Inhalte zu erstellen.

Traditionelle BI

Herkömmliche Business-Intelligence-Programme stützen sich stark auf IT-Personal. Sie erfordern normalerweise, dass Benutzer SQL (eine Programmiersprache, siehe unten) beherrschen, und es dauert viel länger, Antworten zu erhalten, da Sie mehrere Abfragen in dieser Sprache manuell eingeben müssen. Als solche sind sie weitaus weniger agil, und Experten wie die von Gartner schlagen Käufern vor, stattdessen nach Funktionen zu suchen, die in modernen BI-Programmen zu finden sind .

SaaS/Cloud-Software

Software as a Service ist ein Modell, bei dem Käufer Lizenzen zur Nutzung von Software erwerben, anstatt sie zu kaufen und zu installieren. Die meiste SaaS-Software wird über das Internet (dh in der Cloud) erstellt, was die Vorabkosten für Kauf und Installation reduziert. Es beseitigt auch die Notwendigkeit, die Server zu überwachen, auf denen die Software aufbewahrt wird; Das SaaS-Unternehmen verfolgt alle potenziellen Ausfälle.

In Würfel schneiden

Große Datensätze in Scheiben schneiden und würfeln, um die Daten entweder aus verschiedenen Perspektiven zu betrachten oder bestimmte Teile genauer zu betrachten. Mit Slice-and-Dice-Funktionen können Sie beispielsweise Daten nach Woche, dann nach Monat und dann nach einzelnen Tagen überprüfen. Anstatt auf einen Bericht zu warten, können Sie mit Slice and Dice die Initiative ergreifen und die spezifischen Daten bei Bedarf überprüfen.

SQL

SQL, ausgesprochen „Sequel“, ist eine verbreitete Programmiersprache, die zum Abrufen von Informationen aus Datenbanken verwendet wird. Wenn Sie Englisch sprechen, spricht die Datenbank SQL und kann nur so formulierte Fragen beantworten. Es sei denn natürlich, Ihre Business-Intelligence-Software verfügt über eine Abfrage in natürlicher Sprache (NLQ), mit der Sie Fragen genauso stellen können wie eine Suchmaschine.

Begriffe, die Sie wissen möchten …

Oder dass Ihrer Meinung nach die Leser dieser Liste davon profitieren würden? Lassen Sie es mich in den Kommentaren unten wissen. Im Idealfall könnte der Kommentarbereich ein weiterer Ort werden, an dem Leute Definitionen anfordern und ich sie bereitstellen kann.

Wenn Sie wissen möchten, wie diese Begriffe Ihnen besser helfen können, sehen Sie sich eine der Optionen im Business-Intelligence-Softwareverzeichnis von Capterra an und wenden Sie sich an einen Anbieter.