>
MENU
logonumonyx

Intel e STM: un nuovo business flash

moorestown-in-hand

TJVideo: Intel Moorestown, la più piccola scheda madre del...

4 aprile 2008 Visualizzazioni: 608 Tecnologia

Audio: un nuovo formato seppellirà l’Mp3?

Alcuni ricercatori hanno dichiarato di aver sviluppato un nuovo formato audio molto più performante dell’Mp3, sia in termini di qualità che di dimensioni.


Gli scienziati della University of Rochester sono riusciti a riprodurre 20 secondi di musica attraverso un nuovo formato audio di circa 1000 volte più “leggero” di un normale file Mp3.

“Si tratta essenzialmente di un sistema di riproduzione musicale che può essere regolato dagli utenti. Ognuno di loro può infatti manipolare la propria tonalità, il respiro e le pressione delle dita molto velocemente. In questo modo, teoricamente, non dovremmo realmente misurare la musica migliaia di volte al secondo come facciamo con i normali CD”, ha dichiarato il professore Mark Bocko.

Nel loro esperimento, i ricercatori hanno simulato un suonatore di clarinetto modellando le interazioni tra il musicista e lo strumento, inclusa la pressione delle dita, l’intensità del soffio e la pressione delle labbra. “Come risultato di questo processo, penso che siamo riusciti ad identificare la parte minima necessaria a riprodurre un pezzo di musica, riducendo ovviamente la dimensione di ogni singolo file”, ha concluso il professore.

di Vincenzo Ciaglia - TuxJournal.net

twittergoogle_pluslinkedinmail
  • /V

    in pratica un sistema di sintesi a modellazione fisica, lo stesso principio dei codec DPCM usati nella telefonia cellulare (il tutto preso moooolto alla lontana), solo applicata agli strumenti musicali.

    Sembra interessante come sistema, certo che parlare di compressione 1:1000 modellando 1 SOLO CLARINETTO e’ facile. Voglio poi vederli con la filarmonica di londra o anche solo con un pezzo di musica electro a vedere cosa riescono a modellare fisicamente e quale rate di compressione raggiungono…

  • http://alex.amiran.it Shu

    A me sembra che abbiano “riscoperto” il MIDI e i MOD. Anche sul C64 la musica si creava definendo la forma d’onda tramite 4 valori (ADSR, Attack Decay, Sustain, Release), la frequenza (in Hz) e la durata. Qui si tratta solo di modificare leggermente questi valori introducendo la forza del soffio per gli strumenti a fiato, o quella del battito su quelli a tasti, ecc.

    E` ottimo per definire uno strumento, ma non può andare bene per campionare musica, a meno di non codificare ogni “voce” su una traccia separata (appunto come i MIDI e i MOD), ma appena due voci si sovrappongono la forma d’onda si sovrappone e non puoi più definirla in modo semplice. Figurarsi un concerto rock o metal con chitarre distorte o strumenti improvvisati (la chitarra contro la cassa! :) )

    Bye.

  • http://www.spippolazione.net spippolazione

    Posso essere un po’ insospettito dal fatto che l’annuncio sia del 1 di aprile ???

  • http://www.tuxjournal.net vciaglia

    @spippolazione: non credo. Ne parla pure La Repubblica, proponendo quel file audio di 20 secondi: http://www.repubblica.it/2007/09/sezioni/scienza_e_tecnologia/musica-digitale/musica-compressa/musica-compressa.html.

  • http://frafra.wordpress.com Frafra

    Hanno reinventaot il midi :D

  • /V

    Non credo centri troppo col midi. Penso che sia lo stesso principio su cui si basa un vocoder.

    Il vocoder prende un campione audio vocale e lo analizza secondo il seguente modello (grossomodo):
    1) Il parlato e’ composto da sillabe e lettere.
    2) Alcune sillabe sono “vocalizzate” (= sono composte da un tono, pensate alle vocali), altre sono mute (la “s”)
    3) Le sillabe sono create dall’aria che passando per le corde vocali genera un treno di impulsi (le corde che vibrano) che sono poi modellati dalla cavita’ orale e dalle labbra.

    Sulla base di questo esegue la seguente analisi:
    1) Scompone il campione in segmenti della durata media di una sillaba (0.7 secondi credo, basata su dati statistici)
    2) per ogni sillaba verifica se e’ una sillaba vocalizzata o no
    3) se non e’ vocalizzata il segnale di origine sara’ del rumore bianco
    4) se e’ vocalizzata analizza il pitch della sillaba (= il tono)
    5) usa un filtro adattativo per derivare dei coefficienti che modellino il cavo orale (che danno il timbro della voce e la modulazione).

    Questi parametri (1 bit per stabilire se e’ vocalizzata o no, 8 bit per definire il pitch, 8 bit X 10 campioni per modellare il tratto vocale) sono poi trasmessi, e utilizzati da un sitetizzatore che ricrea il parlato:
    1) genera un campione di rumore bianco se la sillaba e’ muta, o un treno di impulsi di frequenza uguale al pitch se e’ vocalizzato
    2) filtra il segnale generato in un filtro FIR con i coefficienti che ha ricavato prima.
    3) accoda tutte le sillabe.

    Cosi’ facendo si ottiene un parlato comprensibilie dall’altro lato trasmettendo meno di 100 bit al secondo.

    Questo poi e’ un modello veramente di base (quello che fanno fare nei laboratori di analisi del parlato). Metto le mani avanti sui dettagli tecnici che e’ un argomento che studiai qualche anno fa. Comunque il principio e’ quello.

    Suppongo che un principio analogo sia stato applicato in questo codec. PEr questo sono scettico che possa funzionare bene con musica elettronica (come lo modellizzi un synth arbitrario?) o fortemente polifonica…

  • marcellinopaneevino

    io penso che sia una cavolata..è impossibile riprodurre in altri formati migliori dell’mp3

  • Marco

    Guarda che l’mp3 di fatto è un formato vecchissimo.
    Già il formato ogg-vorbis, anch’esso vecchio ma più giovane dell’mp3, garantisce una qualità migliore dell’mp3 a parità di bitrate.

  • /V

    marcellino, st’opinione cosi’ fondata ti arriva da dove?

  • NeoSlack

    Beh penso che se il mio clarinetto suonasse anche solo lontanamente come quello del file compresso, al rivenditore glielo tirerei in testa :D

    Cmq è un formato che già a questo livello di sviluppo può trovare sbocchi in molte applicazioni, anche professionali, dove la qualità non è il primo parametro di valutazione.

  • http://www.gnulinuxexperience.com spillo

    “io penso che sia una cavolata..è impossibile riprodurre in altri formati migliori dell’mp3”
    dimmi che è una battuta xD

  • Jena Plisskin

    Un mio collega mi ha fatto sentire via Repubblica il file. Francamente entrambi sentiamo il suono troppo digitale. E’ un poco più “corposo” di un midi, ma francamente per quanto vecchio prefersco l’mp3 , ogg e aac sono decisamente superiori e viste le attuali capacità di storage. Forse per le suonerie vanno bene ma in cuffia preferisco suoni più umani :-)

  • http://salvador2000.wordpress.com/ El Salvador

    “io penso che sia una cavolata..è impossibile riprodurre in altri formati migliori dell’mp3″
    Innanzitutto, ESISTONO formati migliori del mp3. Non pensare che se un formato è popolare dev’essere per forza migliore di tutti e in tutto. Anzi mp3 è un vecchio formato mp3 (nato negli anni ’80) e già esistono da diversi anni formati più efficienti come AAC, MusePack (MPC), OGG Vorbis ed ecc…

    La stessa cosa succede allo zip. Un formato assai vecchio, ma tutt’ora ancora il più utilizzato, nonostante formati giovani e più efficienti (ma non veloci come lo zip) come 7Zip.

  • pachito

    ennesima bufala della rete, ormai dovremmo esserci abituati. Fa parte di quelle notizie che leggi un paio di volte e poi non le rivedrai piu’.