viernes, febrero 09, 2007

Google Patens

Fuente: IPR Helpdesk

Deficiencias de la búsqueda en Google Patens:

  • cobertura limitada a 7 millones de documentos estadounidenses (esto está lejos de constituir todo el estado de la técnica anterior disponible en los documentos de patentes);
  • no es posible ningún truncamiento/ búsqueda aproximativa de las palabras clave o de la clasificación (una característica muy restrictiva);
  • ninguna clasificación europea disponible (ECLA);
  • ningún operador de proximidad;
  • la búsqueda se realiza en imagen ROC (y no como el verdadero texto completo): las palabras separadas por el salto de línea no son recuperadas (ejemplo: ampli- ficación sólo se detecta cuando se utiliza la palabra clave "ampli");
  • problemas de ROC (reconocimiento óptico de caracteres), por ejemplo: US Pat. 2;
  • problema de ROC US 814049: fecha de publicación 6 de marzo de 1000, en lugar de 6 de marzo de 1906;
  • títulos insólitos probablemente debido a problemas de ROC, por ejemplo: "Other Publications", "Prior Art", "xx x xx", "D526233";
  • la búsqueda de "Google" detecta, entre otras respuestas, a US2126697 referente a unas gafas protectoras (“Goggle set”);
  • lista de resultados limitada (máx. 1116 resultados) de los que únicamente pueden mostrarse 600 (máx. 12 páginas de resultados con 50 patentes/página)
  • ejemplos: apparatus = 1116 resultados, method = 1116 resultados, device = 1116 resultados;
  • las búsquedas con/sin el operador “OR” produce diferentes resultados, por ejemplo: business OR method = 1116 resultados, business method = 1100 resultados;
  • la numeración de las páginas de los resultados de la búsqueda no es coherente y no siempre se corresponde con la página real (por ejemplo: la palabra clave "oligonucleotide" en el interior de la patente US4683195 lleva a un orden incoherente de los resultados de la página (2 + página 14), resultados en la página 37 (que es en realidad la columna 37) pese a que no se subraya en esta página o columna (aunque la palabra clave “oligonucleotides” aparece--> ¿búsqueda confusa?);
  • referencia incoherente: la US4683195 se cita en la base de datos de la USPTO (REF/468319) en 1462 patentes, mientras que en Google sólo en 6 patentes

Por otra parte, la indización del texto completo permite búsquedas como:

  1. Búsqueda rápida de un fragmento textual en las patentes estadounidenses: "metal contacts to gallium nitride"
  2. Una búsqueda fácil por el número de referencia, pero atención no existe ninguna garantía de que no se escape algún documento: 5-124,890 ofrece una lista de resultados que incluyen este número de patente japonesa

Lecturas complementarias:

Google Patents descrito en Wikipedia(en inglés)

Un artículo que describe la herramienta (en inglés)

Un análisis profesional exhaustivo: una comparación por periodos de un año entre una búsqueda con la USPTO y una búsqueda con Google Patents, en la que el último produce resultados muy superficiales (en inglés)

Más información sobre la tecnología de ROC utilizada por Google (en inglés)

Una fantástica presentación sobre Google Book Search, con algunos datos sobre la visión de Google (en inglés)

No hay comentarios:

¿Renacimiento del contenido propio?

Llevo ya un tiempo reflexionando sobre los contenidos propios frente a contendios creados a traves de IA. Los blogs tuvieron su máxima expre...