Fugleidentifikasjon etter sang ved hjelp av kunstig intelligens frakoblet

  • Apper som BirdNET og Merlin bruker kunstig intelligens til å identifisere fuglesanger og håndterer allerede tusenvis av arter over hele verden.
  • Nye globale databaser med mer enn 90 000 kommenterte småstein muliggjør trening av mer nøyaktige og robuste modeller.
  • Verktøy for borgervitenskap som iNaturalist, eBird eller Avefy kombinerer kunstig intelligens og offentlig deltakelse for å overvåke biologisk mangfold.
  • Fremtiden ligger i stadig mer presise modeller som også kan fungere pålitelig i frakoblet modus på selve enheten.

Hvordan bruke AI til å identifisere fugler

Å høre en fugl trille i hagen og kunne identifisere den på sekunder er ikke lenger science fiction. Takket være kunstig intelligens brukt på lydI dag kan vi identifisere fuglearter fra sangene deres nesten som om vi hadde en ornitolog i lomma. Det nye er at disse verktøyene tar et sprang fremover: flere og flere prosjekter tar sikte på å gjøre denne identifikasjonen pålitelig selv under ekstreme forhold. Ingen internettforbindelseDette er avgjørende hvis du reiser gjennom skoger, høye fjell eller avsidesliggende landlige områder.

Parallelt publiseres enorme lyddatabaser, nøye kommentert av eksperter, som tjener til å trene og forbedre disse systemene. Denne kombinasjonen av Opptakere, algoritmer og borgervitenskap Det endrer måten vi overvåker biologisk mangfold på og åpner døren for fugleidentifikasjonsapper basert på sang som fungerer mer stabilt, raskt og i økende grad også i frakoblet modus.

BirdNET: kunstig intelligens for å gjenkjenne fugler etter sangen deres

Et av de mest banebrytende prosjektene innen dette feltet er BirdNETDette verktøyet er utviklet i fellesskap av K. Lisa Yang Center for Conservation Bioacoustics ved Cornell Lab of Ornithology og Chemnitz University of Technology, og er basert på dype nevrale nettverk trent med tusenvis av timer med lyd, og er i stand til å foreslå den mest sannsynlige arten fra et opptak av sang eller rop.

BirdNET-appen lar hvem som helst ta opp omgivelseslyd med mikrofonen på Android-mobilen din og motta et estimat av hvilke fugler som synger på bare noen få sekunder. Du kan også laste opp tidligere innspilte lydfiler, noe som gjør det til en svært fleksibelt feltverktøyDu kan legge igjen en opptaker på et eksternt sted, ta filene med deg og analysere dem senere med appen eller tilhørende verktøy.

Systemet gir ikke bare et navn, men indikerer også en sannsynlighetsnivå for hver oppdagede art. Dette er avgjørende når man tolker resultatene: brukeren kan se hvilke lyder som er oppdaget i sonogrammet, sjekke forslagene og vurdere om de gir mening i konteksten (habitat, årstid osv.). Denne kombinasjonen av automatiske forslag og menneskelig verifisering er kjernen i BirdNETs tilnærming.

Hvordan en datamaskin lærer å gjenkjenne fuglesang

For at en datamaskin skal kunne skille en nattergal fra en spurv basert på sangen, må den trenes med en stort antall merkede opptakBirdNET bruker kunstig intelligens og dyplæringsmodeller som analyserer lyd og transformerer den til visuelle representasjoner av lyd, for eksempel spektrogrammer, hvor du kan se hvordan frekvensen endres over tid.

Under trening mottar algoritmen tusenvis av eksempler på sanger fra hver art. Hvert fragment får vite hvilken fugl som synger, og i mange tilfeller også typen vokalisering. Over tid lærer det nevrale nettverket å gjenkjenne karakteristiske mønstre i klangfarge, struktur og rytme av hver art. Når den deretter hører en ny lyd, sammenligner den disse mønstrene med det den har lært for å returnere en liste over sannsynlige arter.

Denne tilnærmingen har en stor fordel: BirdNET er ikke begrenset til noen få lokale arter, men har blitt trent til å gjenkjenne mer enn 3.000 fuglearter fra hele verdenOg i nyere versjoner nevner den allerede mer enn 6.000 potensielle arter. Jo mer den brukes og jo mer data som innlemmes, desto bedre justeres modellene, noe som resulterer i en gradvis økning i nøyaktighet, spesielt for komplekse arter.

4 viktige apper for fugleelskere
Relatert artikkel:
4 viktige apper for fugleelskere

Fordeler og begrensninger ved automatisk identifisering via kant

Langvarige BirdNET-brukere understreker at det fremfor alt er en verktøy designet for feltarbeidNår den er i gang, starter du ganske enkelt opptaket på mobilenheten din og lar algoritmen markere segmenter der den oppdager sang. Sonogrammet som vises av applikasjonen er også en svært kraftig pedagogisk ressurs: det lar deg visualiser sangen og mentalt relatere tegningen av spekteret til det som høres, noe som er veldig nyttig for å lære på gehør.

Selv om nøyaktigheten forbedres raskt, er automatisk lydidentifisering vanskeligere enn den med bilderÅrsakene er varierte: mange telefoner har begrenset mikrofonkvalitet, det er enorm variasjon i samtaler mellom individer og populasjoner, og bakgrunnsstøy (trafikk, vind, andre arter som ringer samtidig) kan komplisere analysen betraktelig. Likevel har vanlige brukere lagt merke til en bemerkelsesverdig hopp i suksessraten med visse arter.

En stor begrensning i mange nåværende BirdNET-installasjoner er at identifikasjon vanligvis utføres i mobilappversjonen på eksterne servereMed andre ord sendes opptaket til skyen, behandles der, og resultatet returneres til brukeren. Dette betyr at foreløpig, i mange tilfeller Datadekning er nødvendig å utnytte appens potensial fullt ut, noe som ikke alltid er mulig i isolerte naturområder.

BirdNET som et pedagogisk og borgervitenskapelig verktøy

Hvordan bruke AI til å identifisere fugler

Utover den spesifikke identifikasjonen, ble BirdNET unnfanget fra begynnelsen også som en borgervitenskapsprosjektBrukere kan sende inn opptakene sine, merket som observasjoner, og dermed bidra til en enorm global database om fuglers utbredelse og fenologi. Denne informasjonen er uvurderlig for forskere innen økologi og bevaring.

Samtidig hjelper bruken av appen allmennheten Bli bedre kjent med artene rundt degÅ ta opp fuglesang, se på sonogrammet og sammenligne resultatene oppmuntrer folk til å lære om fuglers atferd, trekk og leveområder. Ressurser som The Sound Approach-prosjektet, med sitt utmerkede undervisningsmateriell om sonogrammer og fuglesang, passer perfekt til denne tilnærmingen til læring gjennom både hørsel og syn.

Avefy: Lær fuglesang gjennom lek

Mens BirdNET fokuserer på å automatisk identifisere hva som spilles av, fokuserer andre apper på aktiv læring av brukerenEt godt eksempel er Avefy, en app designet som et slags quizspill for å trene øret og forbedre evnen til å gjenkjenne sanger og rop på egenhånd.

Avefys drift er basert på å presentere brukeren opptak organisert av økosystemerDette er det de kaller «lydlandskap»: en middelhavsskog, en elvebredd, høye fjell osv. Innenfor hvert lydlandskap høres forskjellige arter, og brukeren må foreslå hvilke fugler de tror de hører. Tilbakemelding gis ved hvert forsøk, slik at de litt etter litt øret blir mer innstilt og læringen konsolideres.

Denne tilnærmingen minner om eldre opplæringsmateriell for overvåkingsprogrammer som SACRE, men i et oppdatert format og med et bredere utvalg av scenarioer. I tillegg til spillet inkluderer Avefy en sangguide Inne i selve appen finnes det opptak av alle iberiske arter (så vidt vi kan se), slik at du kan konsultere og gjennomgå lyder både hjemme og, hvis du ønsker det, ute i felten.

Læring hjemme kontra identifisering i felten

Hvis vi sammenligner BirdNET med Avefy, kan vi se at de dekker to komplementære behov. BirdNET er først og fremst en automatisk identifikasjonsverktøy Den brukes hovedsakelig i landlige områder: du hører en sang, spiller den inn, og appen foreslår hva det kan være. Avefy, derimot, er designet mer som trenings- og spillplattformIdeell for læring hjemme eller i rolige stunder, uten presset av å ha fuglen foran seg.

I praksis kan det være svært effektivt å bruke begge applikasjonene sammen. BirdNET hjelper deg med å avklare eventuelle tvil når du er ute i felten og ikke kan identifisere en fuglesang, mens Avefy vil... trene øret Slik at du over tid blir mindre avhengig av teknologi for å gjenkjenne vanlige lyder. Og som en bonus kan Avefy-guiden fungere som en rask referanse, akkurat som guidene som er inkludert på andre plattformer som Merlin og eBird.

Fugleidentifikasjon av dvergfalk: identifisering med sang, bilde og spørsmål

En annen sentral aktør i dette scenariet er Merlin Bird ID, også utviklet av Cornell Lab of Ornithology. Selv om den har blitt veldig populær for sin sangidentifikasjonsfunksjon, tilbyr Merlin faktisk tre hovedmåter å identifisere: ved lyd, ved fotografering og gjennom et veiledet spørreskjema om den observerte fuglen.

Lydmodusen er veldig lik i opplevelsen som andre systemer: brukeren trykker på opptaksknappen, lar telefonen være på lydløs og venter på at appen skal lytte. Deretter viser Merlin en liste over arter den anser som sannsynlige, basert på sangen og stedet. Den tillater også lytt til andre opptak av samme art å sammenligne nyanser, og utviklerne selv insisterer på at forslagene deres bare er et utgangspunkt: de anbefaler alltid å sammenligne med beskrivelsene og eksempellydene på hver fugls side.

Bildegjenkjenning er en annen av Merlins styrker. Bare ta et bilde eller velg et fra kamerarullen, så vil appen forsøke å identifisere personen. Hvilken art vises på fotografiet?I tester utført av diverse medier klarte den å identifisere alt fra en storskarv i Madrid til en roseryggpelikan i Senegal. Men som med alle automatiserte systemer gjør den noen ganger feil eller klarer ikke å finne treff når bildet ikke passer.

Merlins tredje modus er det veiledede spørreskjemaet, som er veldig nyttig for personer med lite erfaring med identifiseringAppen stiller enkle spørsmål om farge, størrelse, atferd (om den var på bakken, i vannet, satt i et tre, var i flukt osv.), geografisk plassering og dato. Ved å bruke denne informasjonen kryssrefererer den data med kunnskapsbasen sin og returnerer et sett med sannsynlige arter slik at brukeren kan velge den beste matchen.

Offline bruk og regionale pakker i Merlin

En av attraksjonene ved Merlin Bird ID for de som reiser i områder med dårlig dekning er muligheten til å delvis funksjon frakobletAppen lar deg laste ned regionale fuglepakker, organisert etter geografiske områder, som inkluderer faktaark, sonogrammer, utbredelseskart og lyder fra de vanlige artene i hvert område.

Takket være disse pakkene kan mange av applikasjonens ressurser brukes i landlige eller fjellrike omgivelser uten å trenge en konstant internettforbindelse. Dette er ikke bare praktisk for turgåere og amatørfuglekikkere, men også for forskere og frivillige i overvåkingsprogrammer som utfører tellinger i avsidesliggende områder der mobildekning er upålitelig eller ikke-eksisterende.

Merlin er fullt integrert med eBird, den store globale vitenskapsplattformen for fugler. Innenfor eBird finnes det også en modus for identifikasjonsquiz I likhet med Avefy lar den brukerne øve med både lyder og bilder. I dette tilfellet kan brukerne tilpasse utfordringer basert på spesifikke datoer og steder i stedet for økosystemtyper, noe som bidrar til å trene identifikasjonsferdigheter i kontekster som ligner veldig på de de vil møte på ekskursjonene sine.

iNaturalist, Google Lens og iPhone Visuelt Søk

Selv om fokuset i denne artikkelen er fuglesang, er det verdt å nevne andre verktøy som, selv om de ikke utelukkende fokuserer på fugler, er avhengige av kunstig intelligens for å gjenkjenne arter basert på bilder. iNaturalist, Google Lens og iPhone Visual Search er gode eksempler på hvordan AI har blitt en slags «lommebiolog» for enhver nysgjerrig person.

iNaturalist startet som et akademisk prosjekt ved University of California, Berkeley, og er i dag et felles initiativ med California Academy of Sciences og National Geographic SocietyDet er veldig enkelt å bruke: du tar et bilde av planten, dyret eller soppen du vil identifisere og laster det opp til appen. Systemet foreslår deretter automatisk, i løpet av sekunder, mulige arter basert på datasynsmodeller trent med millioner av observasjoner.

iNaturalists største styrke ligger i det globale fellesskapet av brukere og eksperter, som bidrar til å korrigere og forbedre identifikasjoneneHver observasjon er georeferert og datert, noe som skaper et gigantisk kart over biologisk mangfold i nær sanntid. All denne informasjonen deles med vitenskapelige databaser som GBIF (Global Biodiversity Information System), noe som gjør prosjektet til en uvurderlig datakilde for bevaring og studier av globale endringer.

Når det gjelder iPhones visuelle søk, integrerer Apple AI direkte i operativsystemet. Hvis systemet oppdager et gjenkjennelig element (plante, dyr, monument, kunstverk) når et bilde åpnes, vises et spesielt ikon ved siden av informasjonsknappen. Ved å trykke på den får brukeren tilgang til... grunnleggende informasjon om artenLignende bilder og eksterne lenker. Denne typen gjenkjenning utføres i stor grad på selve enheten, og utnytter datakraften til moderne brikker.

Google Lens utfører en veldig lignende funksjon i Android-økosystemet. Den kan brukes som en frittstående applikasjon eller gjennom Kamera-appen på mange telefoner. Lens analyserer bilder, sammenligner gjenkjente objekter med visuelle databaser, og tilordne sannsynligheter for hvert mulig resultat. Hvis for eksempel AI-en anser det som 95 % sannsynlig at en hund er en schæfer og 5 % sannsynlig at det er en corgi, vil den bare vise det første alternativet, da det er det mest sannsynlige. For planter og dyr foreslår den, i tillegg til å foreslå navnet, å utføre et raskt Google-søk for mer informasjon.

En global database med over 90 000 kommenterte sanger

Det kvalitative spranget innen automatisk sangidentifisering ville ikke vært mulig uten treningsdata av høy kvalitet. I denne forbindelse har en nylig milepæl vært publiseringen av den første globale databasen med detaljerte, kommenterte fuglesanger, ledet av Senteret for skogvitenskap og -teknologi i Catalonia (CTFC) og beskrevet i en dataartikkel i tidsskriftet Ecology.

Denne databasen samler opptak gjort i 72 steder over hele verdensom omfatter mer enn 1.100 forskjellige arter. Nøkkelen er ikke bare datamengden, men det faktum at lokale ornitologiske eksperter i hver fil manuelt har markert det nøyaktige øyeblikket hver art synger, noe som gir opptil mer enn 90 000 merkede vokaliseringer. Dette detaljnivået gir uvurderlig materiale for trene og evaluere algoritmer akustisk gjenkjenning.

Datasettet er åpent tilgjengelig på Zenodo-plattformen, noe som gjør det enkelt for forskningsteam over hele verden å bruke det til begge deler. forbedre eksisterende verktøy som BirdNET Denne databasen kan brukes til å utvikle nye modeller, spesielt for arter eller regioner som har vært underrepresentert frem til nå. Faktisk har denne databasen allerede blitt brukt til å evaluere ytelsen og optimale utførelsesparametere for BirdNET på global skala, noe som bidrar til å forbedre dens oppførsel i ulike kontekster.

Kunstig intelligens og overvåking av biologisk mangfold

Kombinasjonen av feltobservasjon, store åpne databaser og kunstig intelligens endrer måten vi overvåker biologisk mangfoldI en kontekst med akselererte klimaendringer og økosystemtransformasjon er det en stor fordel for vitenskap og miljøforvaltning å ha systemer som automatisk kan registrere og analysere forekomsten av arter.

Automatiserte systemer erstatter ikke ornitologer, men de kan mangedoble observasjonsevnene dineEt sett med autonome opptakere fordelt over et territorium, analysert med algoritmer som BirdNET eller andre modeller hentet fra globale databaser, tillater generering av kontinuerlige tidsserier over hvilke arter som er til stede, på hvilke tider av året og med hvilken relativ frekvens.

Bird bnb på Android
Relatert artikkel:
Finn overnatting for et bredt utvalg av fugler på Bird bnb

Denne typen informasjon er viktig for tidlig oppdagelse endringer i populasjoner, endringer i utbredelsesområder eller ankomsten av invasive arter. Videre fremmer den åpne og reproduserbare naturen til dataene og modellene mer transparent vitenskap, der andre team kan verifisere resultater, foreslå forbedringer og tilpasse verktøyene til nye realiteter.

Etter hvert som disse teknologiene blir mer etablerte og bedre integrert i mobilapplikasjoner og tilgjengelige plattformer, kan vi forvente å se en økning i fungerende verktøy for identifisering av fuglesang. stadig bedre i offline-modusved å laste ned modeller og datapakker direkte til enheten. Nøkkelen vil være å balansere nøyaktigheten med størrelsen på modellene og lokale databaser, og utnytte både kraften til eksterne servere og datakapasiteten til nåværende mobile enheter.

Alt tyder på at det i årene som kommer vil bli vanlig å høre en sang midt i skogen og på sekunder kunne bestemme hvilken art det er, med høy pålitelighet og uten behov for dekning, takket være konvergensen av prosjekter som BirdNET, Merlin, Avefy, iNaturalist og de nye globale databasene med sanger som gir næring til kunstig intelligens. Del denne informasjonen slik at flere kan lære om emnet.


Google Play Store uten Google-konto
Du kan være interessert i:
Hvordan laste ned apper fra Play Store uten å ha en Google-konto
Følg oss på Google Nyheter