Esporta (0) Stampa
Espandi tutto

Codifica di file multimediali con Dolby Digital Plus

Aggiornamento: giugno 2014

La versione 3.0 del Codificatore multimediale di Azure supporta la codifica Dolby® Digital Plus, o Enhanced AC-3 (E-AC-3), un codec audio avanzato di tipo surround appositamente progettato per la creazione di file multimediali di alta qualità. Da home theater e PC a telefoni cellulari e flussi online, la tecnologia Dolby Digital Plus è in grado di offrire prestazioni audio ad alta fedeltà e di qualità cinematografica da qualsiasi dispositivo di intrattenimento. Dolby Digital Plus si basa sulle principali tecnologie Dolby Digital, che rappresentano lo standard consolidato per i sistemi audio di tipo surround di cinema, trasmissioni radiotelevisive e home theater e si stanno progressivamente espandendo nell'ambito dei dispositivi per l'intrattenimento mobile. Le nuove tecnologie avanzate del sistema Dolby, orientate al miglioramento delle prestazioni audio, offrono un'ottima qualità sonora e la possibilità di usare una larghezza di banda ridotta. In questo modo, è possibile visualizzare contenuti di qualità con meno interruzioni, anche quando la larghezza di banda è limitata.

La tecnologia Dolby Digital Plus è supportata dalla versione 3.0 del Codificatore multimediale di Azure. Per ottenere un riferimento a questa versione del codificatore, usare il codice seguente.

private static IMediaProcessor GetLatestMediaProcessorByName(string mediaProcessorName)
        {
            // The possible strings that can be passed into the 
            // method for the mediaProcessor parameter:
            // Azure Media Encoder
            // Windows Azure Media Packager
            // Windows Azure Media Encryptor
            // Storage Decryption

             _context.MediaProcessors.Where(p => p.Name == mediaProcessorName).ToList().OrderBy(p => new Version(p.Version)).LastOrDefault();

            if (processor == null)
                throw new ArgumentException(string.Format("Unknown media processor", mediaProcessorName));

            return processor;
        }

Quando si configurano le impostazioni di codifica per l'uso con una versione 2.x del Codificatore multimediale di Azure, sono disponibili numerosi set di impostazioni predefiniti rappresentati da stringhe di facile memorizzazione. Il codificatore Dolby Digital Plus offre un'ampia gamma di controlli. Per altre informazioni, vedere <DolbyDigitalPlusAudioProfile>. Non sono pertanto disponibili set di impostazioni predefiniti in formato stringa basati su questo codec. È necessario specificare le impostazioni desiderate per il codificatore in un file XML e inviare tali dati insieme all'attività, come mostrato nell'esempio di codice seguente:

string configuration = File.ReadAllText(pathToXMLConfigFile));
            ITask task = job.Tasks.AddNew("My Dolby Digital Plus Encode Task",
                processor,
                configuration,
                _clearConfig);

Questo argomento descrive alcuni set di impostazioni XML di esempio per la configurazione delle impostazioni del codificatore. L'elemento usato per configurare la codifica Dolby Digital Plus è <DolbyDigitalPlusAudioProfile> ed è riportato come nodo figlio dell'elemento <AudioProfile> in un set di impostazioni XML del Codificatore multimediale di Azure. Questo elemento XML contiene più attributi che controllano vari elementi della codifica.

Per eseguire la codifica nel formato Dolby Digital Plus 5.1 multicanale, impostare gli attributi Codec ed EncoderMode su "DolbyDigitalPlus". Per specificare il numero di canali codificati, usare l'attributo AudioCodingMode dell'elemento <DolbyDigitalPlusAudioProfile>. Per la codifica nel formato 5.1 multicanale, impostare AudioCodingMode su "Mode32". Il seguente set di impostazioni XML semplificato mostra l'elemento <DolbyDigitalPlusAudioProfile> usato per la codifica nel formato stereo. In questo elemento è prevista anche la codifica nel canale LFE (Low Frequency Effects), specificato impostando l'attributo LFEOn su true. Per eventuali attributi non specificati vengono impostati i valori predefiniti.

<DolbyDigitalPlusAudioProfile
              Codec="DolbyDigitalPlus"
              EncoderMode="DolbyDigitalPlus"
              AudioCodingMode="Mode32"
              LFEOn="True"
              SamplesPerSecond="48000"
              BandwidthLimitingLowpassFilter="True"
              DialogNormalization="-31">
              <Bitrate>
                <ConstantBitrate
                  Bitrate="512"
                  IsTwoPass="False"
                  BufferWindow="00:00:00" />
              </Bitrate>
            </DolbyDigitalPlusAudioProfile>

Per un set di impostazioni XML completo basato sull'elemento <DolbyDigitalPlusAudioProfile>, vedere Codifica nel formato Dolby Digital Plus 5.1 multicanale.

Per eseguire la codifica nel formato Dolby Digital Plus Stereo, impostare gli attributi Codec ed EncoderMode su "DolbyDigitalPlus". Il numero di canali codificati viene specificato mediante l'attributo AudioCodingMode. Per la codifica nel formato stereo, impostare AudioCodingMode su "Mode20". Il seguente esempio di set di impostazioni XML mostra l'elemento <DolbyDigitalPlusAudioProfile> usato per la codifica nel formato audio 5.1. Per eventuali attributi non specificati vengono impostati i valori predefiniti.

<DolbyDigitalPlusAudioProfile
              Codec="DolbyDigitalPlus"
              EncoderMode="DolbyDigitalPlus"
              AudioCodingMode="Mode20"
              SamplesPerSecond="48000"
              DialogNormalization="-31">
              <Bitrate>
                <ConstantBitrate
                  Bitrate="128"
                  IsTwoPass="False"
                  BufferWindow="00:00:00" />
              </Bitrate>
            </DolbyDigitalPlusAudioProfile>

Per un set di impostazioni XML completo basato sull'elemento <DolbyDigitalPlusAudioProfile>, vedere Codifica nel formato Dolby Digital Plus Stereo.

L'elemento <DolbyDigitalPlusAudioProfile> si trova all'interno di una gerarchia di altri elementi non mostrati negli esempi precedenti per brevità. L'elemento radice di questa gerarchia è <Preset>, a sua volta incluso in un elemento <Presets>. La gerarchia è illustrata dal seguente set di impostazioni XML semplificato.

<Preset Version="5.0">
  <Job />
  <MediaFile
    DeinterlaceMode="AutoPixelAdaptive"
    ResizeQuality="Super"
    NormalizeAudio="True"
    AudioGainLevel="1"
    VideoResizeMode="Stretch">
    <OutputFormat>
      <MP4OutputFormat
        StreamCompatibility="Standard">
        <AudioProfile Condition="SourceContainsAudio">
          <DolbyDigitalPlusAudioProfile>
            <!-- attributes not shown for brevity -->
          </DolbyDigitalPlusAudioProfile>
        </AudioProfile>
      </MP4OutputFormat>
    </OutputFormat>
  </MediaFile>
</Preset>

È possibile eseguire la codifica in più file MP4 all'interno di un singolo set di impostazioni XML. Per ogni file MP4 da generare, aggiungere un elemento <Preset> nella configurazione. Ogni elemento <Preset> può contenere informazioni di configurazione per video, audio o entrambi. Per un set di impostazioni XML completo che mostra la codifica in più file MP4, vedere Codifica in più tracce audio.

Alcuni clienti possono avere l'esigenza di creare un servizio di codifica commerciale basato su Servizi multimediali di Azure. Se si prevede di creare un servizio integrato di questo tipo, è importante che tutti i parametri di codifica Dolby Digital Plus siano disponibili. Assicurarsi che tutti i parametri inclusi nel tag <DolbyDigitalPlusAudioProfile> siano esposti e configurabili da parte dell'utente. Per istruzioni su come rendere disponibili tali parametri, contattare prolicensingsupport@dolby.com.

La versione 3.4 o successiva del codificatore di Servizi multimediali può usare DPLM SDK per misurare la sonorità dei dialoghi nell'audio di input e impostare il valore corretto di DialogNormalization. Questa funzionalità è abilitata solo se l'audio viene codificato in Dolby Digital Plus. DPLM è configurato in un file di configurazione di set di impostazioni mediante <LoudnessMetering>, un elemento figlio di <DolbyDigitalPlusAudioProfile>. Il seguente set di impostazioni di esempio mostra come configurare DPLM:

<?xml version="1.0" encoding="utf-16"?>
<Preset
  Version="5.0">
  <Job />
  <MediaFile>
    <OutputFormat>
      <MP4OutputFormat
        StreamCompatibility="Standard">
    <AudioProfile>
             <DolbyDigitalPlusAudioProfile
               Codec="DolbyDigitalPlus"
               EncoderMode="DolbyDigitalPlus"
               DolbySurroundMode="NotIndicated"
               StereoDownmixPreference="NotIndicated"
               SamplesPerSecond="48000"
               AudioCodingMode="Mode20"
               Channels="2"
               BitsPerSample="24">
               <LoudnessMetering
                 Mode= "ITU_R_BS_1770_2_DI"
                 SpeechThreshold="20"
                 TruePeakEmphasis="false"
                 TruePeakDCBlock="false" />
              <Bitrate>
                <ConstantBitrate
                  Bitrate="320"
                  IsTwoPass="False"
                  BufferWindow="00:00:00" />
              </Bitrate>
     </DolbyDigitalPlusAudioProfile>
    </AudioProfile>
      </MP4OutputFormat>
    </OutputFormat>
  </MediaFile>
</Preset>

L'elemento <LoudnessMetering> può essere specificato solo all'interno di un elemento <DolbyDigitalPlusAudioProfile>. Se si usa l'elemento <LoudnessMetering>, non è possibile usare l'attributo DialogNormalization. Se l'elemento <LoudnessMetering> e l'attributo DialogNormalization vengono usati contemporaneamente, il codificatore genera un errore. Tutti gli attributi di LoudnessMetering sono facoltativi e per impostazione predefinita vengono configurati i valori consigliati da Dolby Laboratories, Inc.

Ogni attributo è descritto nelle sezioni seguenti.

Questo attributo determina la modalità di misurazione della sonorità. I valori consentiti sono i seguenti:

 

Valore Descrizione

ITU_R_BS_1770_2_DI (predefinito)

Indica ITU-R BS.1770-2 più Dialogue Intelligence

ITU_R_BS_1770_1_DI

Indica ITU-R BS.1770-1 più Dialogue Intelligence

ITU_R_BS_1770_2

Indica ITU-R BS.1770-2

LEQA_DI

Indica Leq(A) più Dialogue Intelligence

Nota:

  • La modalità EBU R128 può essere ottenuta con ITU_R_BS_1770_2_DI.

  • Leq(A) è incluso solo per motivi di compatibilità con le versioni precedenti e deve essere usato esclusivamente in specifici flussi di lavoro legacy.

  • ITU ha recentemente rilasciato un aggiornato denominato BS.1770-3, che equivale a BS.1770-2 con TruePeakDCBlock e TruePeakEmphasis entrambi impostati su False.

Specifica una soglia per i dialoghi usati da DPLM per produrre un risultato di sonorità integrato, ad esempio scegliendo un'opzione tra il controllo del discorso, il controllo del livello e nessun controllo. L'intervallo dell'impostazione della soglia del dialogo va da 0% a 100%, con incrementi dell'1%. Questo parametro ha effetto solo quando DPLM è configurato in una modalità che utilizza Dialogue Intelligence, ossia che può essere specificato solo se l'attributo Mode è impostato su ITU_R_BS_1770_2_DI o ITU_R_BS_1770_1_DI. Il valore predefinito, quando Mode è ITU_R_BS_1770_2_DI o ITU_R_BS_1770_1_DI, è pari al 20%. I valori di questo attributo devono essere compresi nell'intervallo da 0 a 100 (con incrementi di 1).

Questo parametro di input specifica se il blocco DC all'interno della misurazione del true-peak è abilitato (True) o disabilitato (False). Per altre informazioni sul blocco DC, fare riferimento a ITU‐R BS.1770‐2. Il valore predefinito è False.

Specifica se il filtro di enfasi all'interno della misurazione del true-peak è abilitato (True) o disabilitato (False). Per altre informazioni sul filtro di enfasi, fare riferimento a ITU‐R BS.1770‐2. Il valore predefinito è False.

Quando un'attività di codifica specifica l'uso di DPLM, i risultati della misurazione della sonorità vengono inclusi nel file XML dei metadati nell'asset di output. Di seguito è riportato un esempio. Nota: la struttura di questo file XML è stata aggiornata a settembre 2013.

<LoudnessMeteringResultParameters 
     DPLMVersionInformation="Dolby Professional Loudness Metering Development Kit Version 1.0"
     DialogNormalization="-15" 
     IntegratedLoudness="-14.8487606" 
     IntegratedLoudnessGatingMethod="2" 
     IntegratedLoudnessSpeechPercentage="11.673481" 
     SamplePeak="-0.7028221" 
     TruePeak="0.705999851" />

Di seguito sono descritti i singoli attributi.

 

Attributo Descrizione

DPLMVersionInformation

Stringa che rappresenta la versione di DPLM SDK in uso.

DialogNormalization

Valore di DialNorm, espresso in decibel, misurato a partire dall'audio di input, che verrà incorporato nel flusso DD+ di output, nell'intervallo {-31, -30, …, -1} dB.

IntegratedLoudness

Sonorità integrata misurata da DPLM, nell'intervallo da -70 a +10 LKFS/dBFS (dove dBFS viene usato solo quando Mode è impostato su LEQA_DI).

IntegratedLoudnessGatingMethod

I valori validi sono:

  1. 0 – Nessuna/Gating non applicato

  2. 1 – Gating in base al parlato

  3. 2 – Gating in base al livello

IntegratedLoudnessSpeechPercentage

Questo risultato contiene la percentuale della sequenza temporale dei dati multimediali di input in cui viene rilevato il parlato. I valori sono compresi tra 0% e 100%.

SamplePeak

Questo risultato contiene il valore massimo di campionamento assoluto in un canale dall'ultimo ripristino della misurazione. I valori validi sono compresi tra -70 e +10 dBFS.

TruePeak

Questo risultato contiene il valore massimo di true‐peak assoluto in un canale dall'ultimo ripristino della misurazione. Per una descrizione del true-peak, fare riferimento a ITU‐R BS.1770‐2. I valori possono essere compresi tra -70 e 12,04 dBTP.

Vedere anche

Mostra:
© 2014 Microsoft