Evitar duplicidades
Antes de incorporar un nuevo documento al sistema debemos asegurarnos de que no exista. Para ello, la mejor forma es realizar una búsqueda utilizando el contenido del documento para asegurarnos de evitar duplicar contenido innecesariamente.
Ejemplo paso a paso
- Realizar una búsqueda, por ejemplo "ciclo del agua"
- Pulsar intro, comprobaremos si existen documentos exactamente iguales o relacionados, para tomar la decisión sobre si debemos subir el documento o no.
- En este caso, y al comprobar que no hay documentos idénticos ni similares, podemos proceder a subir el cotenido en el gestor documental.
Elegir el origen óptimo (tipo de documento)
Documento digital versus documento escaneado
Si se dispone del documento en una fuente digital, incorporar la fuente digital, no el documento escaneado en formato imagen. Esto es así porque el documento en formato digital tendrá un tamaño optimizado, y el interior de su contenido será buscable (algo que se denomina full text search).
Ejemplo
Si tenemos un documento generado a partir de un documento word realizando una exportación de dicho documento a formato PDF, podremos realizar una selección de contenido sobre dicho documento en PDF, y seremos capaces de copiar y pegar texto. Esto también permitirá a Athento detectar este texto e indexarlo, o sea tenerlo almacenado para realizar búsquedas sobre todo el contenido del documento.
Por el contrario, si obtenemos el documento en formato PDF pero además lo tenemos en digital y realizamos su escaneo en alta calidad, dependiendo del tipo de escáner que tengamos, es probable que obtengamos un documento con mucho mayor tamaño (peso) y que además no nos permita buscar texto en su interior, con la dificultad a la hora de encontrarlo que esto implica.
En internet hay gran cantidad de lugares de los que podemos exportar contenidos (noticias, documentos etc) en formato indexado, realizando una exportación a PDF desde nuestro navegador, a copiando y pegando el contenido relevante hacia un documento ofimático (Word etc.).
Documento existente en Internet
Si el documento está ya publicado en Internet, debemos referenciarlo desde el ECM.
Ejemplo paso a paso
Si se trata de una noticia publicada en internet o de un vídeo publicado en Youtube, Vimeo o similar, debemos:
- Generar un documento en el gestor documental
- Rellenar varios de sus metadatos, de forma que pueda ser buscado de forma sencilla.
- En lugar de ubicar un fichero físico, a la hora de crear el documento, podemos crear el documento sin un fichero asociado:
- Una vez creado el documento podremos realizar una referencia a un documento, noticia o vídeo que esté ya publicado en Internet. Para ello debemos ir a la pestaña Relaciones
- Una vez ahí clickar en Crear relación
- Elegiremos las opciones "Tipo de relación", con valor Está basado en o Referencia y luego añadiremos una URL en el campo denominado Objeto relacionado. Por ejemplo https://en.wikipedia.org/wiki/Best_practice
- Una vez añadida la relación, tendremos un documento en el gestor documental (ECM) con sus metadatos e información, referenciando a una web externa y con la ventaja de no ocupar espacio en Athento.
Elegir la opción óptima de Escaneo
Color
En la medida de lo posible, y siempre que no necesitemos escanear alguna imagen o gráfica con colores, realizar un escaneado en blanco y negro.
Ejemplo
Si vamos a realizar el escaneo de un periódico físico en blanco y negro, o de un documento impreso sin imágenes, deberemos optar por la opción en blanco y negro y asegurarnos de que es la que está operativa en el escáner.
Calidad del Escáner
Utilizar una configuración de escaneo de 150-200 dpi, o sea de entre 150-200 puntos por pulgada, para documentos de los que no sea necesario extraer el texto y sea suficiente con el empleo de los metadatos del documento (Título, descripción, origen, fecha de creación etc.),
Utilizar una configuración de escaneo de más de 300 dpi (300 puntos por pulgada) para documentos simples de los que se quiera (o potencialmente se pueda querer) realizar una extracción y análisis automático e inteligente del documento.
Contenido relacionado: