Musikgenrer klassificerade med MIDI-filers entropi

Kommunikation är processen att reproducera ett meddelande skapat i ett punktutrymme vid en annan punkt i rymden. Det har studerats på djupet av många vetenskapsmän och ingenjörer, men det är den matematiska behandlingen av kommunikation som har haft det mest djupgående inflytandet.





För matematiker spelar detaljerna i ett meddelande ingen roll. Allt som spelar roll är att meddelandet kan ses som en ordnad uppsättning symboler. Matematiker har länge vetat att denna uppsättning styrs av grundläggande lagar som först beskrevs av Claude Shannon i hans matematiska teori om kommunikation.

Shannons arbete revolutionerade hur ingenjörer tänker kring kommunikation, men det har långtgående konsekvenser på andra områden också. Språk innebär överföring av information från en individ till en annan och informationsteorin ger ett fönster genom vilket man kan studera och förstå dess natur. Inom beräkningar överförs data från en plats till en annan och informationsteorin ger den teoretiska grund som gör att detta kan göras mest effektivt. Och inom biologi kan reproduktion ses som överföring av genetisk information från en generation till nästa.

Musik kan också ses som överföring av information från en plats till en annan, men forskare har haft mycket mindre framgång med att använda informationsteori för att karakterisera musik och studera dess natur.



Idag förändras det tack vare Gerardo Febres och Klaus Jaffés arbete vid Simon Bolivar University i Venezuela. De här killarna har hittat ett sätt att använda informationsteori för att reta upp karaktären hos vissa typer av musik och för att automatiskt klassificera olika musikgenrer, en berömd svår uppgift inom datavetenskap.

En anledning till att musik är så svår att studera är att den inte lätt översätts till en ordnad uppsättning symboler. Musik består ofta av många instrument som spelar olika toner samtidigt. Var och en av dessa kan ha olika kvaliteter av klangfärg, ljudstyrka och så vidare.

Att fånga allt detta i en uppsättning symboler, tillsammans med vilken individuell tolkning musikern lägger till, är en knepig sak. Det har inte stoppat forskare att försöka, om än med begränsad framgång.



Febres och Jaffé tacklar detta problem på ett anmärkningsvärt enkelt sätt med hjälp av en gemensam standard för digitalisering av musik som kallas MIDI. En MIDI-fil är en digital representation av ett musikstycke som kan läsas av en mängd olika datorer, musikspelare och elektroniska instrument.

Varje fil innehåller information om ett musikstyckes tonhöjd och hastighet, volym, vibrato och så vidare. Detta gör att musik skapad på en plats kan återges exakt på en annan plats.

Men en MIDI-fil i sig är helt enkelt en ordnad serie av 0:or och 1:or och detta gav Febres och Jaffé ett sätt att analysera den med hjälp av standardinformationsteori. Faktum är att de helt enkelt öppnade varje fil som en .txt och läste den resulterande sekvensen av till synes slumpmässiga symboler.



Det fina med informationsteorin är att de verktyg som utvecklats för att komprimera meddelanden som skickas till Mars eller för att analysera språkets komponenter kan tillämpas lika på vilken uppsättning symboler som helst. Och det som Febres och Jaffé har gjort.

De började med att komprimera varje uppsättning symboler till det minsta antal som krävs för att generera originalmusiken. Denna grundläggande uppsättning tillät dem sedan att mäta entropin eller informationsinnehållet förknippat med varje musikstycke.

Men de studerade också hur denna entropi varierade över tiden. De studerade faktiskt hur denna andra ordningens entropi varierade i 450 stycken från 71 kompositörer och 15 olika perioder eller typer av musik.



Till sin förvåning fann de att musik från samma genre delade liknande värden för denna andra ordningens entropi. Samtidigt visar denna typ av analys hur musikgenrer har utvecklats över tid.

Det är ett intressant arbete som ger ett fascinerande nytt sätt att studera musik. Det finns några varningar såklart. Medan vissa musikgenrer är tydligt identifierbara på detta sätt, överlappar andra till synes olika stilar.

Till exempel upptar venezuelansk och indisk Raga-musik unika regioner i detta parameterutrymme. Olika klassiska kompositörer ockuperar också specifika regioner och kan därför potentiellt identifieras med denna metod.

Men i genomsnitt överlappar rockmusik och klassisk musik kraftigt, vilket gör det svårt att automatiskt identifiera dem. Framtida arbete kan förbättra saken, kanske genom att till exempel öka storleken på databasen.

Ändå har Febres och Jaffé gjort betydande framsteg med en teknik som borde vara allmänt användbar. Deras nästa uppgift, om de skulle välja, är att hitta ett sätt att tillämpa sin metod, kanske för musikrekommendationssystem, innan någon annan ger sig in i handlingen.

Ref: arxiv.org/abs/1510.01806 : Music Viewed by Its Entropy Content: A Novel Window for Comparative Analysis

Dölj