Table of contents
TOC
Comprimi il sommario
Espandi il sommario

Estrarre e analizzare oggetti strutturati da contenuto String

OpenLocalizationService|Ultimo aggiornamento: 14/12/2016
|
1 Collaboratore

Sono state anche introdotte alcune funzionalità aggiuntive per il cmdlet ConvertFrom-String:

  • Rimozione della proprietà extent per il testo per impostazione predefinita. È possibile includerla con il parametro -IncludeExtent.

  • Molte correzioni di bug per l'algoritmo di apprendimento grazie ai commenti e suggerimenti di MVP e community.

  • Un nuovo parametro -UpdateTemplate per salvare i risultati dell'algoritmo di apprendimento in un commento nel file di modello. In questo modo il processo di apprendimento (la fase più lenta) diventa un costo una tantum. L'esecuzione di Convert-String con un modello che contiene l'algoritmo di apprendimento codificato è ora quasi istantanea.

Estrarre e analizzare oggetti strutturati da contenuto String

In collaborazione con Microsoft Research è stato aggiunto il nuovo cmdlet ConvertFrom-String.

Questo cmdlet supporta due modalità: l'analisi delimitata di base e l'analisi basata su esempi generati automaticamente.

L'analisi delimitata divide l'input per impostazione predefinita in corrispondenza di spazi vuoti e assegna i nomi delle proprietà ai gruppi risultanti. È possibile personalizzare il delimitatore:

1 [C:\temp] >> "Hello World" | ConvertFrom-String | Format-Table -Auto

P1 P2


Il cmdlet supporta anche l'analisi basata su esempi generati automaticamente in base al lavoro di ricerca FlashExtract condotto da Microsoft Research.

A titolo di esempio, si supponga di iniziare da una rubrica basata su testo:

Ana Trujillo

Redmond, WA

Antonio Moreno

Renton, WA

Thomas Hardy

Seattle, WA

Christina Berglund

Redmond, WA

Hanna Moos

Puyallup, WA

Copiare alcuni esempi in un file, che verrà usato come modello:

Ana Trujillo

Redmond, WA

Antonio Moreno

Renton, WA

Racchiudere i dati da estrarre tra parentesi graffe, assegnando anche un nome. Dato che la proprietà Name e le altre proprietà associate possono comparire più volte, usare un asterisco (*) per indicare che i risultati includeranno più record, invece di estrarre una serie di proprietà in un unico record:

{Name\*:Ana Trujillo}

{City:Redmond}, {State:WA}

{Name\*:Antonio Moreno}

{City:Renton}, {State:WA}

Da questo set di esempi, ConvertFrom-String può ora estrarre automaticamente output basato su oggetti dai file di input con una struttura analoga.

2 [C:\temp]

>> Get-Content .\addresses.output.txt | ConvertFrom-String -TemplateFile .\addresses.template.txt | >>> Format-Table -Auto

ExtentText Name City State


Ana Trujillo... Ana Trujillo Redmond WA Antonio Moreno... Antonio Moreno Renton WA Thomas Hardy... Thomas Hardy Seattle WA Christina Berglund... Christina Berglund Redmond WA Hanna Moos... Hanna Moos Puyallup WA

Per apportare ulteriori modifiche ai dati nel testo estratto, la proprietà ExtentText acquisisce il testo non elaborato da cui è stato estratto il record. Per fornire commenti e suggerimenti su questa funzionalità o per condividere contenuto per cui risulta problematica la scrittura di esempi, inviare un messaggio di posta elettronica a psdmfb@microsoft.com.

© 2017 Microsoft