Pràctica d’Arquitectures Orientades a les Aplicacions

 

Comparació de cadenes usant la distància de Levenshtein.

 

Dissenyar un sistema sistòlic per a la comparació de cadenes usant la distància de Levenshtein.  El programa haurà de ser implementat amb c-stolic i compilat amb ccs.

L’objectiu del programa és que, donada una paraula concreta, trobi les paraules que més s’assemblen d’un conjunt de noms.

 

Entrades del programa:

1. fitxer_cerca: Nom del fitxer de paraules amb format ascii.

2. paraula: Paraula a cercar

3. num_paraules: nombre de paraules a mostrar.

 

Sortides del programa:

1. fitxer_trobat: Nom del fitxer de les num_paraules paraules trobades amb format ascii. El fitxer ha d’estar format per dues columnes. En la primera hi haurà la paraula trobada i a la segona la distància amb paraula. Les paraules han d’estar ordenades per mínima distància. Encara que en el fitxer fitxer_cerca es repeteixin paraules, en el fitxer

fitxer_trobat no es poden repetir.

 

Feina a fer:

  1. Implementar el programa en format no sistòlic
  2. Implementar el programa en format sistòlic intentant reduir els temps de còmput encara que sigui en depriment del nombre de blocs usats.
    1. Dissenyar l’esquema de blocs.
    2. Mostrar el programa amb comentaris.
    3. Mostrar el nombre de cicles necessaris per calcular la distància entre dues paraules de n i m caràcters respectivament.
  3. Fer el joc de proves. Passar fitxers petits amb paraules seleccionades i comentar els resultats i les distàncies obtingudes. Després passar un fitxer gran amb un qualsevol text o conjunt de paraules (per exemple un diccionari). Comparar i verificar que els resultats entre els dos sistemes són iguals i correctes.