import os
import requests
#!pip install python-dotenv
from dotenv import load_dotenv
load_dotenv()

API_KEY = os.environ['API_KEY']
audio_name = "data/1654219149_1654219209.wav"

r = requests.post('https://api.labacam.org/predictions', 
                  params={'model': 'PANN-tag-5s'},
                  headers={'accept': 'application/json', 'x-api-key': f'{API_KEY}'}, 
                  files={'file': open(f'{audio_name}', 'rb')})

predictions = r.json()['categories']


%matplotlib inline
from plotting_utils import plot_prediction_matrix

plot_prediction_matrix(predictions)


import torchaudio
from IPython.display import Audio

waveform, rate = torchaudio.load(audio_name)
Audio(data=waveform[0].numpy(), rate=rate)

Using the FuSA API to analyze audio¶