ARCHIVED WEBSITE i
You are viewing a static snapshot of this website, preserved for documentation purposes. Some links and interactive features may no longer work as originally intended.
Inicio Metodología Metodología emparejamiento

La cartera de patentes (prioritarias) de un grupo industrial se define como el conjunto de patentes (prioritarias) registradas por el “Global Ultimate Owner” (GUO) y por sus filiales consolidadas; es decir, aquellas de las que el GUO posee una participación total superior o igual al 50,01%.

La aplicación de esta norma requiere emparejar por una parte los nombres de los GUO de los grupos y filiales extraídos de la base de datos financieros utilizada (Orbis) y, por otra parte, los nombres de los depositantes aparecidos en las solicitudes de patentes. Automatizar este emparejamiento requiere que las cadenas de caracteres que componen los términos buscados coincidan de manera idéntica, lo que plantea dos tipos de dificultades.

Las dificultades vinculadas al cruce de bases de datos

En primer lugar, una misma empresa puede aparecer con nombres y grafías diferentes en la base de patentes. Por ejemplo: ‘IBM’ e ‘International Business Machines’. Por tanto, es complejo agrupar las patentes registradas bajo estas distintas variantes del mismo nombre conforme a una única etiqueta. Esta dificultad se superó utilizando los nombres armonizados propuestos en la base de datos Patstat (véase Fuentes de Datos). Éstos permiten reunir la mayoría de las distintas variaciones del nombre de un mismo depositante bajo una única designación armonizada.

La segunda dificultad estriba en que el nombre del depositante que aparece en los documentos de patentes puede no corresponder siempre exactamente al nombre jurídico de este depositante (GUO o filiales) tal como ha sido propuesto por Orbis, y que además puede también diferir de la designación común de esta entidad. Sirva como ejemplo el grupo neerlandés comúnmente designado como ‘Philips’, cuyo GUO aparece bajo el nombre ‘Koninklijke Philips Electronics NV’.

Una normalización previa a la comparación de cadenas de caracteres

La técnica de emparejamiento utilizada en el proyecto Corporate Invention Board se basa en las investigaciones realizadas por Tom Magerman, de la Universidad Católica de Louvain. La metodología desarrollada por este investigador, en colaboración con la Organización para la Cooperación y el Desarrollo Económico (OCDE), la Dirección General la EUROSTAT de la Comisión Europea y la Oficina Europea de Patentes (OEP), cubre esquemáticamente dos etapas. En primer lugar, es necesario proceder a una etapa de limpieza ortográfica destinada, por ejemplo, a suprimir los dobles espacios que pueden aparecer indebidamente entre dos palabras o los espacios blancos que preceden una coma.

A continuación, las designaciones legales de las empresas (como Ltd, Corp, su, Inc.) que aparecen sistemáticamente en la base de información financiera Orbis, pero raramente en los datos de las patentes, se suprimieron con el fin de mejorar la aproximación entre la información resultante de las bases de datos de patentes y las financieras.

Esta metodología de emparejamiento permitió definir más de 5 millones de patentes prioritarias, registradas por los aproximadamente 2400 grupos estudiados.

Un margen de error reducible pero inevitable

Como en todo tratamiento masivo de datos, sería ingenuo pretender definir sin error el conjunto de las patentes de los grupos estudiados. El objetivo consiste en proceder al arbitraje más satisfactorio entre los ‘falsos positivos’ y los ‘falsos negativos’. El primer caso consiste en asignar una patente erróneamente a una empresa; mientras que en el segundo, la patente registrada por una empresa no llega a ser identificada y no puede pues integrarse en la cartera de patentes de dicha empresa.

Ante semejante trabajo de identificación automatizada, un margen de error sigue siendo inevitable. El objetivo consiste en ser capaces de reducirlo en las ediciones posteriores del Corporate Invention Board. En primer lugar, gracias a los progresos metodológicos de definición que permitirán mejorar los emparejamientos entre los nombres, seguido de las mejoras aportadas a la base de datos Patstat (véase Fuentes de Datos). En segundo lugar, gracias a las interacciones que a las que deseamos comprometernos con los grupos estudiados en el marco de esta primera edición del Corporate Invention Board.