Microsoft Lumos is nu open-source en maakt het mogelijk om statistieken van webapps te volgen en snel afwijkingen op te sporen door valse positieven te elimineren

Microsoft / Microsoft Lumos is nu open-source en maakt het mogelijk om statistieken van webapps te volgen en snel afwijkingen op te sporen door valse positieven te elimineren 3 minuten gelezen

Microsoft



Microsoft heeft toegang verleend tot ‘Lumos’, een krachtige Python-bibliotheek voor het automatisch detecteren en diagnosticeren van metrische regressies in applicaties op 'webschaal'. De bibliotheek is naar verluidt erg actief geweest binnen Microsoft Teams en Skype. In wezen is een zeer krachtige en intelligente ‘anomaliedetector’ nu open source en beschikbaar voor webontwikkelaars om regressies in belangrijke prestatiestatistieken op te sporen en aan te pakken, terwijl de meeste valse positieven bijna worden geëlimineerd.

Microsoft Lumos is nu open source. Het werd actief gebruikt in geselecteerde Microsoft-producten en zal nu beschikbaar zijn voor de algemene web- en app-ontwikkelingsgemeenschap. De bibliotheek stelde ingenieurs naar verluidt in staat om honderden wijzigingen in metrische gegevens te detecteren en duizenden valse alarmen te weigeren die door anomaliedetectoren werden veroorzaakt.



Lumos verlaagt het percentage valse positieven met meer dan 90 procent, beweert Microsoft:

Lumos is een nieuwe methodologie die bestaande, domeinspecifieke anomaliedetectoren omvat. Microsoft verzekert echter dat de Python-bibliotheek het percentage fout-positieve meldingen met meer dan 90 procent kan verminderen. Met andere woorden, ontwikkelaars kunnen nu vol vertrouwen aanhoudende problemen aanpakken in plaats van periodieke problemen die op de lange termijn geen nadelig effect hadden.



De gezondheid van online services wordt meestal gecontroleerd door de Key Performance Indicator (KPI) -statistieken in de loop van de tijd te volgen. Ingenieurs die een ‘regressieanalyse’ uitvoeren, hebben veel tijd en middelen nodig om problemen uit de wereld te helpen die op grote problemen kunnen duiden. Deze problemen kunnen leiden tot oplopende operationele kosten en zelfs tot verlies van gebruikers als ze niet worden aangepakt.



Het is onnodig om toe te voegen dat het opsporen van de hoofdoorzaak van elke KPI-regressie tijdrovend is. Bovendien besteden teams vaak veel tijd aan het analyseren van de problemen om te ontdekken dat ze slechts een anomalie waren. Dit is waar Microsoft Lumos van pas komt. De Python-bibliotheek elimineert het proces om vast te stellen of een wijziging het gevolg is van een verschuiving in de populatie of een productupdate door een geprioriteerde lijst te bieden van de belangrijkste variabelen bij het verklaren van veranderingen in de metrische waarde.



Microsoft Lumos dient ook het bredere doel om het verschil in een metriek tussen twee willekeurige datasets te begrijpen. Interessant is dat het platform 'bias' bevat, en door een controle- en behandelingsdataset te vergelijken terwijl het agnostisch blijft ten opzichte van de tijdreekscomponent, kan Lumos de afwijkingen.

Hoe werkt Microsoft Lumos?

Microsoft Lumos werkt met de principes van A / B-testen om paren datasets te vergelijken. De Python-bibliotheek begint met het verifiëren of de regressie in de metriek tussen datasets statistisch significant is. Vervolgens wordt een populatiebiascheck en biasnormalisatie uitgevoerd om rekening te houden met eventuele populatieveranderingen tussen de twee gegevenssets. Lumos besluit dat het probleem niet de moeite waard is om na te streven als er geen statistisch significante regressie in de statistiek is. Als de delta in de metriek echter statistisch significant is, markeert Lumos de kenmerken en rangschikt ze op basis van hun bijdrage aan de delta in de doelmetriek.

De Lumos Python-bibliotheek dient als de belangrijkste tool voor het monitoren van honderden meetgegevens. Ontwikkelaars en teams die prestatieanalyses uitvoeren, kunnen de betrouwbaarheid van telefoongesprekken, vergaderingen en PSTN-services (Public Switched Telephone Network) bij Microsoft controleren en eraan werken. De bibliotheek werkt op Azure Databricks, de op Apache-spark gebaseerde big data-analyseservice van het bedrijf. Het is geconfigureerd om te worden uitgevoerd met meerdere taken die zijn gerangschikt volgens prioriteit, complexiteit en metriektype. De taken worden asynchroon voltooid. Het betekent dat als het systeem een ​​anomalie detecteert, een Lumos-workflow wordt geactiveerd en de bibliotheek vervolgens op intelligente wijze analyseert en controleert of de anomalie de moeite waard is om na te streven en aan te pakken.

Microsoft heeft opgemerkt dat Lumos niet gegarandeerd alle regressies in services opvangt. Bovendien vereist de service een groot aantal datasets om betrouwbare inzichten te bieden. Het bedrijf is van plan om continue metriekanalyses op te nemen, een betere functieclassificatie uit te voeren en ook functieclustering in te voeren. Deze stappen moeten de primaire uitdaging van multicollineariteit bij het rangschikken van functies aanpakken.

Tags Microsoft