Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Gestión Documental: Conceptos, Tecnologías y Aplicaciones de la IA, Esquemas y mapas conceptuales de Biblioteconomía y Documentación

Este documento explora los conceptos fundamentales de la gestión documental, incluyendo su definición, fases y procesos. Además, se analizan las tecnologías de inteligencia artificial (ia) que están revolucionando la gestión documental, como el procesamiento del lenguaje natural (nlp), el aprendizaje automático (machine learning) y el reconocimiento óptico de caracteres (ocr). Se presentan ejemplos de aplicación de la ia en diferentes sectores, como la gestión de expedientes académicos y la automatización en el sector bancario.

Tipo: Esquemas y mapas conceptuales

2023/2024

Subido el 18/02/2025

helena-lopez-1
helena-lopez-1 🇲🇽

3 documentos

1 / 25

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 1: INTRODUCCIÓN A LA DOCUMENTACIÓN
LA SOCIEDAD DE LA INFORMACIÓN Y EL CONOCIMIENTO
Incremento creciente del valor de la información.
+
Avance de las comunicaciones.
+
Explosión documental.
(Cuanta más información más nos cuesta elegir)
+
Vida útil del documento.
(la información se queda obsoleta)
=
Saturación y redundancia informativa
(implican una pérdida de tiempo)
Solución:
Gestión y organización de la información
Datos: Es un conjunto discreto, de factores objetivos sobre un hecho real. Conjunto de valores que se puede definir.
Los datos no son opinables es un hecho, aunque la gente pueden manipularla.
Información: Es un mensaje, normalmente bajo la forma de un documento o algún tipo de comunicación audible o
visible. La información sí es opinable. Es la relación que estableces entre los datos.
Conocimiento: Es una mezcla de experiencia, valores, información y "saber hacer" que sirve como marco para la
incorporación de nuevas experiencias e información, y es útil para la acción.
Ejemplo: saga de los simios. Las sagas nuevas tienen que basarse de la información y datos de las anteriores porque los
fanáticos de ciencia ficción, te lo harán saber.
Lo que hagamos con los datos y la información se puede llegar a un conocimiento, pero no necesariamente.
FUENTES DE INFORMACIÓN
Todo aquello que informa es una fuente de información.
Declaración: fuente de información que se hace en el momento, es decir, no podemos acceder a la información
posterior.
Documento: fuente de información que trata de recoger en un soporte físico (vídeo, escrito, etc.), esa información sirve
para acceder a ella.
Grado de originalidad:
-Primarias: Información que directamente contiene esa fuente.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19

Vista previa parcial del texto

¡Descarga Gestión Documental: Conceptos, Tecnologías y Aplicaciones de la IA y más Esquemas y mapas conceptuales en PDF de Biblioteconomía y Documentación solo en Docsity!

TEMA 1: INTRODUCCIÓN A LA DOCUMENTACIÓN

LA SOCIEDAD DE LA INFORMACIÓN Y EL CONOCIMIENTO

Incremento creciente del valor de la información. + Avance de las comunicaciones. + Explosión documental. (Cuanta más información más nos cuesta elegir) + Vida útil del documento. (la información se queda obsoleta) = Saturación y redundancia informativa (implican una pérdida de tiempo) Solución: Gestión y organización de la información Datos: Es un conjunto discreto, de factores objetivos sobre un hecho real. Conjunto de valores que se puede definir. Los datos no son opinables es un hecho, aunque la gente pueden manipularla. Información: Es un mensaje, normalmente bajo la forma de un documento o algún tipo de comunicación audible o visible. La información sí es opinable. Es la relación que estableces entre los datos. Conocimiento: Es una mezcla de experiencia, valores, información y "saber hacer" que sirve como marco para la incorporación de nuevas experiencias e información, y es útil para la acción. Ejemplo: saga de los simios. Las sagas nuevas tienen que basarse de la información y datos de las anteriores porque los fanáticos de ciencia ficción, te lo harán saber. Lo que hagamos con los datos y la información se puede llegar a un conocimiento, pero no necesariamente.

FUENTES DE INFORMACIÓN

Todo aquello que informa es una fuente de información. Declaración : fuente de información que se hace en el momento, es decir, no podemos acceder a la información posterior. Documento : fuente de información que trata de recoger en un soporte físico (vídeo, escrito, etc.), esa información sirve para acceder a ella. Grado de originalidad : -Primarias: Información que directamente contiene esa fuente.

-Secundarias: Remite a la fuente que contiene la información, es decir, que no tiene la información, pero sabe quién lo tiene. Cobertura : pueden ser generales (ej: biblioteca de la uni) o especializadas (ej: la biblioteca de filmoteca). Depende también del nivel de usuario, no cualquier usuario puede acceder a dichas bibliotecas. Soporte : pueden ser audiovisuales (único y exclusivo de contenido audiovisual como las cintas antiguas de películas), digitales (pueden tener algo audiovisual) e impresas. Autoridad- Fiabilidad: pueden ser formales (entramos a la página oficial de la uni para consultar la fecha de un examen) o informales (cuando un compañero de clase nos dice la fecha de un examen). Tres definiciones de documento: Documento según diccionario Robert Todo escrito que sirve como prueba o información. Documento según la Union Française d’Organismes de Documentation Todo elemento de conocimiento o fuente de información registrada, materialmente susceptible de ser utilizada para consulta, estudio o prueba. Documento según la Norma UNE 50-113-92/ Información registrada que puede considerarse como unidad en un proceso de documentación (entendiendo por Documentación “Recogida tratamiento de información registrada, de forma continua y sistemática y que permita su almacenamiento, recuperación, utilización y transmisión”). Bill Gates afirmó que " el aspecto más excitante de la documentación digital es la redefinición del documento mismo ". Esto sugiere que las nuevas tecnologías han cambiado el concepto de documento. Sin embargo, esta idea no es cierta. López Yepes define el documento como " la objetivación de un mensaje en un soporte físico transmisible y transformable en el espacio y en el tiempo, a fin de remediar una necesidad informativa y constituirse en fuente de información para obtener nuevo conocimiento o para la toma de decisiones ". Según esta definición, la naturaleza del documento no cambia con las tecnologías, porque su esencia sigue siendo la misma: transmitir información y ser una fuente de conocimiento. Lo que sí han hecho las nuevas tecnologías es permitir la creación de nuevos tipos de documentos (como archivos digitales o interactivos) que antes no existían por falta de medios. A pesar de estos cambios, la función del documento sigue siendo la misma, aunque ahora utilice herramientas más avanzadas. -Cambia para adaptarse a las ventajas que le da la nueva tecnología, pero eso no cambia su naturaleza misma. -Lo que ha cambiado es que podemos acceder de forma más rápida a esos documentos. Recursos informativos, documentos digitales u objetos digitales:

  1. Fuente de referencia Diccionario + Tecnologías web=Diccionarios.com
  2. Documento primario Revista + Tecnologías web=Hipertex.net
  3. Documento secundario Bibliografía + Tecnologías web=Bibliografía nacional en línea Aplicaciones web, documentos digitales u objetos digitales:
  4. Fuente de referencia Enciclopedia + Apliación web 2.0=Wikipedia
  5. Documento primario Diario personal + Aplicación web 2.0=Blog
  6. Documento secundario Catálogo + Aplicaciones web=Catálogo de la Biblioteca de la URJC Según Sartori "Quien se aventura en la red informativa y se permite observar que un rumor no informa o que una información falsa desinforma es, para Negroponte y sus seguidores, un infeliz que aún no ha comprendido nada, un despojo de una vieja cultura muerta y enterrada. A la cual yo me alegro de pertenecer". Un cuadro es un documento, la óptica de documento se ha ampliado. La tecnología ha hecho que algunos documentos que no existían, existiesen. Ha cambiado en la forma en que accedemos a los documentos son más rápidos (ej: Wikipedia), pero la naturaleza del documento en sí con sus definiciones no ha cambiado (ej: diccionario).

Es el modo informativo que tiene por objeto la valoración, selección, clasificación y archivo para su posterior uso, de textos y referencias sobre ideas, hechos, juicios y opiniones, con el fin de elaborar la información periodística. Documentación informativa (Codina, 2000) Conjunto de ciencias y técnicas documentales al servicio de: a) la producción de informaciones de actualidad, b) el incremento de su calidad, c) su almacenamiento y conservación y d) su difusión y reutilización. Hoy en día, almacenar documentos no es suficiente. Es necesario garantizar que esos documentos puedan ser reproducidos en el futuro. Si una biblioteca no cuenta con el software necesario para abrir un archivo, es como si no tuviera el documento. Para conservar realmente la información, existen dos opciones:

  1. Actualizar formatos y soportes : Transferir los documentos a formatos modernos para que sigan siendo accesibles.
  2. Preservar los reproductores y el software originales : Guardar las herramientas necesarias para abrir los archivos antiguos. En la práctica, la primera opción es la más utilizada actualmente. Además, la documentación tiene como objetivo principal:
  3. Organizar los documentos para facilitar su acceso.
  4. Adaptarse a los nuevos problemas que surgen con el avance tecnológico, como la necesidad de conservar documentos en formatos que pueden volverse obsoletos o protegerlos frente a riesgos como el secuestro de datos o la desaparición de programas.

PROCESO DOCUMENTAL

El proceso documental tiene una doble finalidad:  Facilitar la recuperación y uso de los mismos por parte de los usuarios.  Garantizar su conservación. Las tareas pueden agruparse en cuatro fases:

1. Fase de entrada : consiste en la recopilación de documentos que se necesita para hacer un trabajo. o Selección (porque hay muchos documentos y es la más importante de esta fase). o Adquisición (es la compra) o Registro (el mecanismo) 2. Fase de tratamiento : es una fase documental, lo que se hace es un análisis de los documentos para extraer los datos por los cuales cada uno accede al documento. o Análisis formal ficha (son datos que están en el documento y identifican formalmente al documento, es decir, que no es de su contenido). o Análisis de contenido clasificación, indización y resumen. (describir a temática de ese documento) 3. Fase de salida : fase en la que publicitamos a colección o lo hacemos accesible al público. o Catálogos y bases de datos o Boletines de sumarios. o Boletines de novedades. 4. Fase de mantenimiento : mantener la colección (volver a encuadrar, mantenimiento físico de la colección o conversión de formatos) o Administrativas (si hay que volver a encuadernar qué hay que volver a encuadrar, a quien se le van a mandar la encuadernación, etc.). o Gestión. o Planificación (dependiendo de la actividad que tenga el centro de documentación habrá que planificar cuando estableces el resto de medidas de mantenimiento).

TEMA 2.- RECUPERACIÓN DE INFORMACIÓN Y BASES DE DATOS.

Buscar información: datos (SGBDR y fuentes de información) y documentos (SRI y navegación) Concepto:

Proceso en el que un conjunto de datos o de documentos son "interrogados" para encontrar ítems que puedan ayudar a satisfacer las necesidades de información de un usuario. Recuperación de datos Recuperación de documentos Recuperación directa que responde la pregunta del usuario. Ej: Quiero saber X. (Método de respuesta al usuario). Recuperación indirecta que proporciona o referencia a un conjunto de documentos que probablemente contenga la respuesta a lo que pregunta el usuario. Ej: Quiero saber sobre X. Necesariamente , existe una relación entre una pregunta bien construida y la respuesta correcta. Probablemente , existe una relación entre una pregunta bien construida y la respuesta correcta El criterio para medir el éxito de una búsqueda es la corrección de la respuesta. Evaluación objetiva. ¿Es la respuesta correcta? El criterio para medir el éxito de una búsqueda es su utilidad. Evaluación subjetiva. ¿Se ha satisfecho la necesidad del usuario? La velocidad de la recuperación depende sobre todo de la velocidad del acceso físico del sistema que se utilice. La velocidad de la recuperación depende sobre todo del número de decisiones lógicas que el usuario debe tomar durante el desarrollo de la búsqueda y sólo secundariamente de la velocidad del acceso del sistema que se utilice. PROCEDIMIENTO DE BÚSQUEDA Y LENGUAJES DE INTERROGACIÓN. El modelo de las seis habilidades para la recuperación de información.

1. Definición de la tarea. a. Definir el problema de información. b. Identificar la información que se necesita para completar la tarea (para resolver el problema de información). 2. Estrategias de búsqueda de información. a. Determinar el rango de las posibles fuentes (brainstorming). b. Evaluar las posibles fuentes diferentes para determinar prioridades (seleccionar las mejores fuentes) 3. Localización y acceso a. Localizar las fuentes (intelectual y físicamente). b. Encontrar la información en las fuentes. 4. Uso de información a. Comprender (leer, oir, ver, tocar..) la información de la fuente. b. Extraer información relevante de la fuente. 5. Síntesis a. Organizar la información de múltiples fuentes. b. Presentar la información. 6. Evaluación a. Juzgar el producto (efectividad) b. Juzgar el proceso de resolución del problema (eficiencia)

LENGUAJES DE INTERROGACIÓN (Pregunta de examen)

Todas aquellas opciones que podamos utilizar para elaborar la pregunta al sistema de la base de datos. Se compone de los operadores lógicos boléanos, operadores de proximidad, limitadores de campo, rangos y paréntesis. Cada sistema tiene uno diferente. Operadores booléanos:

Los paréntesis : no es un operador en sí, son auxiliares. Ayudan a dar prioridad a la información que está entre paréntesis. Actúan como las matemáticas. No son ni precisos ni exhaustivos. Qué palabras claves usarías, y con que operadores las relacionarías para recuperar toda la información relativa a los nacionalismos en españoles (pregunta de examen). Hay que justificar por qué usas cada uno de los operadores. Con que operadores uniríamos: nacionalistasY(EspañaO “terra galega”O Euskadi O catalán) *truncamiento EVALUACIÓN DE LA RECUPERACIÓN DE INFORMACIÓN. La evaluación de recuperación de información la podemos efectuar de dos modos:

1. Proceso de búsqueda: Es más amplio que la estrategia.

  1. Errores materiales en la transcripción del dato o en la pregunta del usuario (que podríamos teclear mal la palabra de búsqueda).
  2. Deficiencias en la interacción del usuario y el sistema (el hombre le dice a la máquina que la maquina no entiende).
  3. Descripción inadecuada de los contenidos (ocurre cuando los documentos en el sistema están mal etiquetados o clasificados, lo que dificulta encontrar información relevante).
  4. Retraso en la carga de novedades al sistema (la información más reciente no está disponible en el sistema porque no se ha actualizado a tiempo). 2. Estrategia de búsqueda: Dos medidas: exhaustividad y precisión: -Exhaustividad. El porcentaje de documentos relevantes recuperados en una búsqueda con respecto al total de documentos relevantes de la base de datos. Es decir, mide cuántos documentos relevantes logras recuperar de todos los documentos relevantes que existen en la base de datos (tocar todo). -Precisión. El porcentaje de documentos relevantes recuperados en una búsqueda con respecto al total de los documentos recuperados. Es decir, mide qué proporción de los documentos que recuperas son realmente relevantes (tocar solo lo que yo quiero). Principio que guía una búsqueda: Una búsqueda debe alcanzar alta exhaustividad, recuperando casi todo aquello que es relevante, y manteniendo al mismo tiempo una alta precisión, rechazando una gran proporción de lo que no se desea. Cuando esto ocurre los valores de la búsqueda se dice que son próximos a uno (100%). Realidad de una búsqueda: Exhaustividad y precisión tienden a variar inversamente de tal forma que a mayor precisión menor exhaustividad y viceversa. Son inversamente proporcionales. No se puede utilizar a la ve el Y y el O, es decir, no se puede abrir y cerrar un grifo a la vez. Relevante No relevante Recuperado A B No recuperado C D ¿Como sería una búsqueda perfecta? aquella exhaustividad y la precisión al 100%, esto sí es posible si yo busco un documento y encuentro ese documento. Pero este tipo de búsqueda no se dan, lo que necesitamos es cubrir una necesidad de información y por tanto, necesitamos varios documentos que den respuesta a esa necesidad de info, en esa circunstancia es imposible lograr 100% exhaustiva y precisa. Si la búsqueda es excesivamente exhaustiva recuperaremos muchos documentos q nos interesa, pero por el contrario recuperamos muchos q no nos interesa. Esos documentos q no nos interesan se llama ruido. Y cuando una búsqueda es demasiado precisa lo q genera es silencio , es decir, la ausencia de doc o info q no sería pertinente. Exhaustividad= a /(a+c). Nº doc relev. recup./nº doc relev. a: Número de documentos relevantes recuperados. c: Número de documentos relevantes no recuperados. Si todos los documentos relevantes se recuperan entonces "c"=0 y la exhaustividad es perfecta 1.0 (100%). Si (c>a) la exhaustividad será baja.

En el peor caso no se recuperan documentos relevantes y (a=0) y exhaustividad=0. Exhaustividad ->Flecha ruido Cuanto más exhaustiva sea la búsqueda, más documentos no relevantes (ruido) se incluyen. ¿Cómo se alcanzaría la "perfecta" exhaustividad? Recuperando toda la base de datos=>precisión nula. Para lograrla, tendrías que recuperar todos los documentos de la base de datos. Pero esto incluye muchos no relevantes, por lo que la precisión será muy baja o nula. Precisión=a / (a+b). Nº doc relev. recup/nº doc recup. a: Número de documentos relevantes recuperados. b: Número de documentos no relevantes recuperados. Si no se recupera ningún documento no relevante entonces "b"=0 y la precisión sería perfecta 1.0. Si "b" es mayor respecto a "a", la precisión será baja. Si se recuperan documentos no relevantes, entonces "a"=0 y precisión=0. Precisión ->Flecha silencio Cuanto más precisa sea la búsqueda, más documentos relevantes (silencio) se pierden porque estás recuperando menos. ¿Cómo se alcanzaría la precisión "perfecta”? Conociendo y recuperando previamente un documento que sabemos que se adecua a lo que buscamos. Pero esto significa que no estás buscando otros documentos relevantes, por lo que la exhaustividad será muy baja o nula. Pregunta de examen : ¿Qué operadores tienden a la exhaustividad/ precisión y por qué? MÉTODOS Y HERRAMIENTAS DE BÚSQUEDA EN LA WEBMotores de búsqueda : o BD generado automáticamente por exploración cíclica de la red realizada por un robot o se indizan todas las páginas web de todos los servidores explorados o se actualiza automáticamente cuando la página vuelve a explorarse o se indiza el texto (todo o parte) de cada página encontrada o la búsqueda se realiza sobre ese texto o puede buscarse sobre un tema del que no se tengan conocimientos previos o Ej.: Google [también tiene un directorio]  Directorios: Como herramienta de búsqueda existen dentro de la info especializada de forma generalista. o BDs de sitios web con descripciones cortas, organizadas por categorías o descripciones creadas por editores profesionales o voluntarios o autores de sitios web o se actualiza si lo hace el autor o el reseñador de la página o la búsqueda se hace sobre las descripciones o se busca seleccionando menús sucesivos o consultando (por palabras clave) la BD de descripciones o se requiere un conocimiento mínimo del tema que se busca o Ej.: Directory World [También tiene un motor de búsqueda] Metabuscadores: son herramientas que permiten realizar una búsqueda en varios motores al mismo tiempo, usando una sola interfaz y estrategia de búsqueda. Lo que hace es lanzar una búsqueda a las distintas herramientas de búsqueda de la web. Ej : Coperni

  • Te informan cuando aparece nueva información relevante, incluso si no estaba disponible antes. -No se limitan a un solo buscador como Google, sino que consultan múltiples fuentes a la vez.
  • Son útiles cuando un buscador concreto no encuentra nada sobre un tema determinado.  Multibuscadores: Agrupan en una misma página formularios para realizar búsquedas en diversos motores. -Te permite buscar publicaciones, hashtags o perfiles en Instagram y en otras redes sociales al mismo tiempo, desde una sola página. Así no tienes que buscar directamente en cada red social por separado. En un mismo punto agrupar las distintas opciones de búsqueda de distintos buscadores agrupar eso es un multibuscador. Actualmente, no existen porque están integradas en los navegadores. Ej: Wikipedia Directorios, índices o catálogos de recursos: Los directorios que se siguen utilizando son los especializados por el tipo o formato de info que tienen.

GOOGLE (www.google.com) -Puesta en marcha: 1999. La BDs de Google se hace automáticamente, es decir, al no tener que asignarle ninguna categoría no hay nadie que tendría que asignar esa categoría. La cantidad de docs q contiene la BDs es tremendamente grande. -Alcance BD:1 billón de documentos (2008 google no aporta nuevos datos desde ese año) o páginas Web (y documentos .pdf, .ps, .rtf, .doc, .xls, .ppt) indizadas a texto completo o otras no (o parcialmente) indizadas, referenciadas por las anteriores -Actualización de la Base de Datos: mensual (aprox.) -Interfaz de búsqueda: búsquedas básica y avanzada (contra la misma base de datos) La búsqueda se hace por medio de robots. Todo lo q es web libre es susceptible de ser visitada, lo que hace un robot es visitar, es decir, se le configura para que visite a partir de una página todas las páginas de determinadas direcciones. Google asume que las pág. web está dentro de un directorio muy profundo dentro de un servicio significa q el grado de interés de la pág. es menor q los q están más arriba, es decir, la estructura de un directorio. Entonces se le configura una ruta de navegación y él va (trae todas las URLS de las pág. q ha visitado). Una vez de esas páginas se hace un índice dependiendo del motor de búsqueda, puede hacerlo el robot inicial o se hace a posteriori. El índice establece cuáles son las palabras con significado de todas las pág. q hay en la BDs y las almacena en un índice global. La mayoría de BDs funcionan a partir de índices, lo que hace es buscar a partir de índice las palabras que interesan al lado de esa palabra, aparecerán los registros de BDs donde se halla esa palabra. Al momento en el q software, repasa todos los contenidos del documento para saber qué palabras hay y almacenar las palabras en el índice, se le llama indización. Ésta puede ser automática o manual, la que hace los motores es automática. Finalmente, el motor de búsqueda lo compone un software de recuperación, es decir, un interfaz con el que el usuario realiza la búsqueda.  Búsqueda básica: o Se expresan uno o varios términos significativos o Deben estar todos en el documento (operador por defecto: AND) o No existe el operador OR o -término: exclusión de un término (NOT) o Búsqueda de frases:  entrecomillado doble  expresiones que incluyen guion, barra, punto, apóstrofo o signo igual o No hay truncamiento o Mayúsculas y minúsculas indistintas o Palabras vacías (y letras o dígitos sueltos)  Las ignora en la búsqueda, pero las indiza  Para forzar su búsqueda: +palabra Vacía Los criterios de búsqueda de Google están diseñados para identificar y priorizar los sitios web que muchas personas enlazan y asocian con una palabra clave específica. Esto indica que dichos sitios tratan sobre el tema relacionado con esa palabra. Por tanto, todos los motores de búsqueda ordenan los resultados mostrando primero las páginas más relevantes para la consulta del usuario.  Búsqueda avanzada. Su interfaz permite además: o Incluir sólo (o excluir) documentos en un sitio web o dominio o Incluir sólo (o excluir) documentos en un formato concreto (.pdf, .ps, .rtf, .doc, .xls, .ppt) o Incluir sólo documentos cuando los términos parecen en título, texto, URL del documento o del enlace o Incluir sólo documentos en una lengua dada o Incluir sólo documentos actualizados recientemente o Encontrar páginas que enlazan con una dada (por su URL)  puede hacerse también en campo de búsqueda: link:URL  no puede combinarse con una búsqueda normal o Encontrar páginas similares a una dada (por su URL)  puede hacerse también en campo de búsqueda: related:URL  Visualización de resultados: o Documentos indizados o referenciados por éstos o Muestra el número de documentos encontrados y de cada uno  Título o URL (si no tiene o el documento no está indizado)  Extractos de texto con términos de búsqueda en contexto y negrita  URL y tamaño

 Descripción y categoría, si el documento está en el directorio de Google (v.) o Orden de visualización: Los documentos se presentan antes si:  están muy referenciados por otros (PageRank, tecnología propietaria)  según el número de referencias procedentes de otras páginas, y  según el número de referencias de éstas últimas  los términos de búsqueda están próximos o Si en el mismo sitio web se encuentran varios documentos  el segundo en relevancia se muestra sangrado  los restantes se agrupan bajo un enlace que remite a ellos o Permite el acceso a una copia del documento en la BD de Google (cached)  no actualizada, corresponde al momento de la indización  si el documento ha sido indizado y el propietario no solicita el borrado  incluye una cabecera indicando que es una copia  los términos de búsqueda están resaltados  útil si no se tiene acceso al original (caída del servidor o borrado del documento) o Permite el acceso a páginas similares o relacionadas o Puede mostrar un sólo documento por búsqueda, supuestamente el más relevante, usando el botón "I'm Feeling Lucky" o "Voy a tener suerte"  Opciones de personalización: o Elegir la lengua de la interfaz (15) y de los documentos hallados o Fijar el número de documentos hallados que se presentarán en una página o Activar el filtro SafeSearch de pornografía (sitio, término o frase, categoría, SurfWatch) NO VA A PREGUNTAR NI COMO SE BUSCA EN GOOGLE DETERMINADA COSA NI COMO SE BUSCA EN NIGUNA OTRA FUENTE DETERMINADA COSA. Q OPERADOR USAR PARA NO SE QUÉ SÍ , EXACTAMENTE COMO SE ESCRIBE EL OPERADOR EN GOOGLE U OTRO NO. Web invisible o profunda Web Visible: Páginas Web, formadas fundamentalmente por texto, incluidas en los índices de los motores de búsqueda. Es de acceso público. Web Invisible o profunda: Páginas con texto, ficheros u otro tipo de información, generalmente de alta calidad, disponible en la www que los motores de búsqueda generalistas no pueden recuperar e indizar por limitaciones técnicas o por elección deliberada. No todas son ilegales, la web q es invisible es toda web q no se puede indizar por parte de los motores de búsqueda, cualquier web q no pueda tener acceso libre, por definición es una web invisible. Todo aquello q pida usuario y contraseña no es de libre acceso y por eso no es utilizable por un motor. Características:  En realidad, no existen contenidos técnicamente invisibles.  Son invisibles para las herramientas de recuperación de información que habitualmente utilizamos: fundamentalmente motores de búsqueda.  Difícilmente recuperables si no se sabe dónde buscar.  Lo que es invisible hoy puede convertirse en visible mañana. ¡Google estima que en 50 años será capaz de indizar la totalidad de la Web Invisible! TIPOS Y ELEMENTOS DE LAS BASES DE DATOS Las bases de datos son: Volúmenes de información digitalizada, en formato alfanumérico y/o gráfico, accesible a través del ordenador, en soporte electrónico que son creadas, mantenidas y explotadas por un programa informático (SGBD, Sistema Gestor de Bases de Datos). Tipos de SGBD:

 Relacionales :

Estos sistemas organizan la información en tablas , estructurando los datos en filas y columnas. Permiten realizar operaciones algebraicas para gestionar la información, y los campos tienen una extensión definida , es decir,

  1. ¿Qué información necesitamos para poder identificar a un alumno? IdAlumn@, Nombre, Apellidos, Localidad, Edad y Teléfono ¿Qué información identifica a los profesores? DNI, Nombre, Apellidos, Titulación, Nacimiento, Dirección, Ciudad, Código Postal y Fecha de contrato ¿Cuáles son los datos para describir un curso? Código, Nombre, Sede, Materia e Inicio ¿Cómo localizar las sedes? Código, Dirección, Localidad y Código Postal. ¿Cómo relacionar al profesor con el curso que imparte, los alumnos matriculados y la sede en la que se desarrollará? Los cursos son impartidos por uno o varios profesores que a su vez pueden intervenir en varios cursos, relación N:M, además la propia relación tiene un atributo, ¿cuántas horas imparte el profesor en el curso, ¿cuánto cobrará? Los alumnos reciben un curso y la relación no tiene atributos propios. Cada curso se imparte en una de las sedes.
  2. Es necesario que sea el mismo término el que se emplee para la descripción del contenido de los cursos similares y que ese término no se use en cursos diferentes. Por ejemplo, los cursos titulados Javascript, HTML, CSS y Dreamweaver, los tres primeros deben llevar la materia: lenguajes web pero no el último. Los nombres de las personas deben introducirse en la misma forma siempre, José L., José Luis, J. Luis; tres formas diferentes de un mismo nombre es tratado como tres nombres diferentes por la aplicación. TEMA 3.- DOCUMENTOS TEXTUALES. En esta parte vamos a analizar los documentos textuales que se refieren a los documentos de carácter informativo. CARACTERÍSTICAS DE LA DOCUMENTACIÓN La evolución del estudio de la Documentación Periodística ha identificado diferentes características sobre el objeto a tratar, la información de actualidad. García Gutierrez y Lucas en 1987 [1]definieron entre otras: Enciclopedismo: Ningún tema es ajeno al interés informativo, tanto del medio como del público del mismo. La temática es, por tanto, potencialmente infinita e incluso puede ser inter y multidisciplinar. El trabajo documental informativo tiene que estar abierto, consecuentemente, a nuevos ámbitos, tanto en lo relativo a las fuentes de verificación como en lo relacionado con la organización documental de cara a la recuperación. Constantemente se estarán actualizando, por ejemplo, categorías temáticas, índices... Universalidad: La información de actualidad tiene vocación universal en tanto en cuanto puede proceder de cualquier lugar geográfico, de cualquier fuente posible, transmitirse por cualquier medio (por ejemplo, Internet actualmente. Los blogs son, cada día más, fuentes de información de actualidad) y dirigirse a cualquier público. Despersonalización de fuentes: En muchos casos, el camino desde la recepción de una información (procedencia incierta) hasta su presentación final produce una pérdida de autoría y, consecuentemente, de responsabilidad acerca de la misma; y, al mismo tiempo y por contraste, para el público que confía en un medio concreto éste es fuente de información fiable. Moda y espectáculo: Temas intrascendentes se convierten en noticias de actualidad que generan cantidades ingentes de documentos que pueden saturar una base de datos (por ejemplo, el tema del traje de boda de Belén Esteban). Dispersión de fuentes: Mientras las fuentes informativas de actualidad no tienen fronteras ni geográficas, ni de enfoques, ni de modos, no de audiencias, ni de tipos de hechos, la Documentación Informativa debe reunir en una misma base de datos todos los temas, hechos, modos,..., que recogen los documentos de su medio, es decir, debe concentrar todos y procurar servirlos al usuario (comunicador) de manera sencilla y accesible. Obsolescencia: El período de vigencia de una noticia de actualidad es muy corto, el documentalista informativo debe separar las noticias que pueden tener interés más adelante de las que no pasan de ser meras anécdotas. Con el consiguiente riesgo de perder documentos que luego puedan ser usados para programas de anécdotas tan de moda últimamente (programas de zapping, por ejemplo). A estas características Amat y Blanco añadieron en 1996 [2]: Redundancia cíclica:

Existe un gran número de informaciones de actualidad que se repiten de manera cíclica (el tiempo, datos estadísticos de natalidad, paro, operaciones salida y entrada de vacaciones,...). La misma cadencia de la vida humana se produce según unos patrones que se repiten (boda, nacimeinto de hijos, divorcio,...). Esta característica facilita a la Documentación Informativa el proceso selectivo de muchas informaciones de actualidad que se sabe de antemano que serán necesarias en un período de tiempo fijado. Ej: en septiembre, el caso de la vuelta al cole, hay sucesos que se dan todos los años en las mismas fechas. Multiplicidad de soportes: Los documentos de los medios pueden ser escritos, gráficos, de audio, audiovisuales, o combinaciones de ellos. El tratamiento documental es distinto para cada tipo, pero ante una necesidad informativa, el documentalista debe servirlos todos independientemente de su soporte, salvo que el usuario nos exprese alguna indicación al respecto. El hecho de que el resultado final de la info vaya a ser un doc textual no implica para que tu no hayas tenido que consultar fuentes en todos los soportes y viceversa. Es decir, el hecho de que tu resultado final sea una pieza audiovisual no significa q no tengas q consultar todo tipo de soportes informativos para preparar tu nuevo documento. Ej. El documental del pulpo es un soporte audiovisual, para desarrollarlo se han consultado fuentes escritas y probablemente fuentes sonoras. Latencia: Aunque las informaciones de actualidad se cierran y acaban en un período más o menos largo de tiempo, siempre existe la posibilidad de que se reabran. Ley del mínimo esfuerzo: La información de actualidad debe servirse en un tiempo muy corto, lo que produce poca elaboración de los documentos que se presentan al público en muchos casos. Lo anterior provoca que muchos documentos no alcancen la calidad necesaria para ser conservados como futuras fuentes fiables de las informaciones recogidas en ellos. Básicamente consiste en informar de la forma mas rápida posible, ej: con la Dana de Valencia las primeras noticias no están desarrolladas, porque lo que se búsqueda es la inmediatez, estar informado a tiempo real. La omisión: (falta datos) Los documentos en los que se recoge la información de actualidad omiten datos siempre por distintos motivos: espacio, premura, línea editorial,.. Las omisiones de datos deben ser suplidas por el documentalista en el momento de guardar los documentos seleccionados porque, pasado un tiempo, es muy difícil localizarlos. Existen distintos tipos de omisión que corren paralelas a los motivos que la causan en cada caso: -Omisión doxológica: De forma consciente sabe que falta datos. Los datos omitidos se conocen, pero no aparecen los documentos. Esta omisión es, por tanto, deliberada y puede ser, a su vez: manipulativa (los datos no presentes se usan para resaltar otros presentes o para sugerir determinadas interpretaciones), o neutral (los datos omitidos son suficientemente conocidos como para no tener que recordarlos al público, es decir, todos lo saben). -Omisión agnósica: Los datos omitidos no se conocen y se produce una omisión involuntaria provocada por la ignorancia. -Omisión impuesta: Los datos omitidos lo son por razones de espacio, tiempo. PROCESO DOCUMENTAL DE LOS TEXTOS Selección de los documentos peridísticos En el centro de documentación de cualquier medio existen unos criterios de selección que velen porque los documentos necesarios estarán en él a disposición de los usuarios cuando los necesite. Qué docs se selecciona o qué docs no selecciona en un centro de documentación periodística.

1. Exclusión: Evitar la duplicación de contenidos, no introduciendo documentos cuyo contenido informativo ya se encuentre en otro documento o fuente fiable. En ningún momento se almacenará dos documentos de lo mismo, es decir, que no aporten nada. A la hora de contratar o comprobar si la fuente ha sido fiable es posible que en ese proceso contrastación de fuentes sí que puedes tener más

Del documento Resumen De los contenidos informativos del documento Clasificación: Identificadores temáticos generales Temática general a la que pertenece el documento Indización: Identificadores temáticos específicos Temática concreta sobre la que informa el documento Personajes implicados Personajes de los que se informa Lugar(es) de desarrollo Lugares geográficos en los que se desarrollan los hechos sobre los que se informa. Código IPTC Códigos de marcado de documentos periodísticos establecidos por el International Press Telecommunications Council Resumen: Es una representación abreviada y precisa del contenido de un documento, sin interpretación ni crítica y sin mención expresa del autor del resumen. Indicativo: Indica los temas superficialmente. Informativo: Representa explícitamente los aspectos significativos. Analítico: Evalúa la aportación del documento al desarrollo del conocimiento. Clasificación: Descripción del contenido de un documento determinando su tema principal y uno o dos temas secundarios que se traducen a términos normalizados de un lenguaje documental: Indización: Representación del contenido de un documento de forma analítica, es decir, enumerando los conceptos y/o palabras contenidos en el lenguaje de documental empleado: Leguajes documentales: Lista de palabras empleadas en el procesos de clasificación e indización que pueden ser:. Libres: Se construye a la sobre la base de la indización en lenguaje natural de los documentos ya registrados:  Lista de palabras clave.  Lista de descriptores libre Controlados: Se construyen a priori y recogen los términos que podrán emplearse en la indización:  Lista de Autoridades  Tesauros FUENTES DE INFORMACIÓN  Legislación: o Publicidad y Comunicación Institucional (nivel estatal y autonómico) o BOE (legislación estatal) o Aranzadi (de pago)  Datos estadísticos: o INE o CIS o Statista (de pago)  BD bibliográficas: o Dialnet (Ipmark Anuncios, Control .. mixta) o CSIC. Bases de datos o Google académico  Hemerotecas de prensa: o MyNews (de pago) o MSN noticias o Google Noticias recoge sólo las ediciones electrónicas de fuentes informativas en castellano pero no españolas por la legislación vigente (gratuito)  Estudios de mercado: o Ebiquity (antigua Xtreme Information, de pago)

o Informa (antigua Data Monitor, de pago) o MDK (de pago)  Seguimiento en redes sociales: o Social Mention (gratis) o Hootsuits (de pago con versión de evaluación) o Rebold (de pago)  Medios: o AIMC o Oblicua o Formulatv TEMA 4.- DOCUMENTOS SONOROS La definición de documento sonoro es todo documento que transmita el contenido de forma audible. Dentro de documentos sonoros, habrá documentos sonoros como entrevista de radio. Qué diferencia hay entre una entrevista emitida en un programa radio o en esa misma entrevista de hecho es el mismo programa de radio a posterior de su emisión inicial, escuchado por un oyente bajo la categoría de podcast, es exactamente lo mismo es el mismo archivo y tiene las mismas características. Desde el punto de vista documental cómo maneja la información que tú tienes en formato audible tiene la misma consideración y naturaleza esa información tienes que escribir de la misma manera, sea como sea. Características generales de la documentación sonora La gran expresividad de los sonidos puede concretarse en los siguientes puntos señalados por Cebrián Herreros[ 1 ]:  Narran el ambiente de una situación mostrándonos la realidad. Son capaces de narrar una situación por sí sola, es decir, no es necesaria la imagen para contar una escena.  Sirven de fondo para la información. El sonido sirve tanto de contexto o de fondo como de transmisor de la información es decir genera ese contexto que nos transmita una situación u otra, y obviamente como canal que transmite una información.  Pueden convertirse en información (no todo sonido es información ni puede o debe convertirse en hecho noticioso).  Subrayan una acción, un hecho, una declaración. Es decir, cualquier sonido de segundo plano va a generar esa situación de contexto, generalizado, pero un efecto puntual en un momento dado puede transmitir o aumentar el significado de lo que se estaba escuchando en ese momento. Ejemplo: si yo me enfado y doy un golpe fuerte ese golpe también está transmitiendo información. O en una película de miedo no puede faltar el sonido del chirrido de la puerta.  Valoran con redundancia la palabra o la música.  Sustituyen la palabra por otro tipo de sonido. Un sonido puede evocar una situación, una persona, un lugar, etc.  Contrapuntean palabras, música y silencio. De hecho, en sonido es igual que la musical, es tan importante el sonido como la ausencia de él. Es importante una nota que un sonido. En el sonido es tan valioso aquello que suena como aquello que no suena. Para resaltar una palabra simplemente una pausa larga, en principio y en final de la palabra.  Aumentan el clima en una situación determinada.  Fijan y concretan una situación. Este mismo autor determina las principales funciones de la información sonora que se concentran en torno a tres ejes: o Sonido como documento/testimonio de la realidad: representa de manera exacta los acontecimientos recogidos por el sonido. Es decir, hay que tener en cuenta que desde el punto de vista testimonial la voz de una persona testimonial o algo puede ser considerado una prueba a nivel leal. o Sonido como expresividad: el sonido ambiente es el más expresivo de la diferente tipología sonora ya que es la mejor manera de representar emociones y sentimientos que no siempre dejar entrever la palabra. Es decir, en poder que tiene el sonido en la memoria humana es que es capaz de fijarse en nuestra memoria de forma subconsciente, es decir mucho de lo que recibimos en vía de sonido es subconsciente si tú des cualquier esquema de acción sin volumen, no te genera ese grado de adrenalina, el sonido te está fijando tanto a nivel testimonial como a nivel expresivo. EL ANÁLISIS DOCUMENTAL EN LA RADIO Cuando se hace un análisis documental es para poder recuperar la información, lo más rápidamente y precisamente posible, es decir, cuanta más previsión de reutilización de archivos sonoro de turno pues, más tratamiento documental tendrá. Por eso esta primera opción q es la descripción cuando se emite, se da fundamentalmente, en más en aquellos programas, en los que hay más probabilidad de que se utilice alguno de los contenidos del programa eso suele pasar sobre todo cuando alguien entrevista.

Descripción en el centro de documentación Cuyo soporte del año 99 es una cinta que hay que reproducir, si yo no tengo un dispositivo capaz de reproducir una cinta, tener este documento sería inútil es como no tener nada. El acceso de información no depende de un dispositivo por lo tanto si el soporte se mantiene tú puedes llevar a la información el problema en este tipo de información es que hay que tener en cuenta primero que la cinta esté en buen estado de conservación y segundo tener acceso al dispositivo con el cual se reproducía esa información. El sonido sea cual sea tiene siempre la necesidad de aparte del soporte un dispositivo que reproduzca ese sonido. Para conservar el sonido necesitamos ambas cosas. Se hace un resumen de temas de amenazas, terrorismo, negociación política y se hace un resumen de cuales han sido todas las declaraciones. En realidad el resumen no hace una transcripción de las declaraciones sino q da un contexto a las declaraciones. Ficha usada en RNE [ 3 ] SIGNATURA: P 30 CT 018322 <04> TITULO: (DECLARACIONES DE ARNALDO OTEGUI, LÍDER DE EUSKAL HERRIETARROK, EN LAS QUE ACUSA AL PP DE PRACTICAR SU "KALE BORROKA" TRAS EL REGISTRO DE LA SEDE DE HB EN SAN SEBASTIÁN Y DEL CONCEJAL DEL PARTIDO POPULAR EN ERANDIO, VICTORINO FERNÁNDEZ, QUE HA VUELTO A VER DESTRUIDO SU NEGOCIO, EN LAS QUE MUESTRA SU DISPOSICIÓN A NO MARCHARSE DEL PAÍS VASCO Y A VOLVER A PRESENTARSE A LAS ELECCIONES) DESC. FISI: CT DURACIÓN: 00:01:10 FECHA GRA: 19990315 CALIFICAC: DECLARACIONES ÁMBITO: PAÍS VASCO DESCRIF: 1999 VOCES: contenido: OTEGUI: ARNALDO nación ESPAÑA cargo duración LÍDER DE EUSKAL HERRIETARROK15 SEG. ....lengua CASTELLANO FERNÁNDEZ: VICTORINO ....nación ESPAÑA ....cargo CONCEJAL DEL PARTIDO POPULAR EN ERANDIO ....duración ....lengua 55 SEG.CASTELLANO TEMAS: AMENAZAS * TERRORISMO * NEGOCIACIÓN POLÍTICA RESUMEN: EL LÍDER DE EH, ARNALDO OTEGUI DICE, TRAS EL REGISTRO DE LA SEDE EN SAN SEBASTIÁN, QUE EL PP PRETENDE SABOTEAR EL PROCESO DE DIALOGO ABIERTO DE HB Y LO CALIFICA COMO "LA KALE BORROKA DEL PP". POR SU PARTE EL CONCEJAL DEL PARTIDO POPULAR EN ERANDIO, VICTORINO FERNÁNDEZ, QUE HA VUELTO A VER DESTRUIDO SU NEGOCIO, DICE QUE LA CALLE ES DE LOS VIOLENTOS, QUE NADIE LES DETIENE Y NADIE LES HACE NADA. DECLARA QUE EL 10 DE ENERO RECIBIÓ UNA CARTA CON AMENAZAS Y QUE NO LE PERMITEN VIVIR TRANQUILO, PERO ADVIERTE QUE NADIE LE VA A ECHAR DEL PAÍS VASCO, Y SI SU PARTIDO LO CONSIDERA OPORTUNO, SE VOLVERÁ A PRESENTAR A LAS ELECCIONES. CATALOGO: CATALOGO DE POLÍTICA NACIONAL SITUACIÓN: PRENDIENT CONTROL: UPRR19 REFERENCI: P FECHA ENT: 19990824 No son sólo documentos de carácter informativo los que se organizan en una fonoteca, también existe toda una "galería de efectos" que son demandados para crear ambiente en determinados programas. Efectos La descripción que se hace en los efectos sonoros es diferente porque no tiene un valor informativo.  Título para el efecto conciso y representativo. Es decir, si el efecto, lo que coge es una puerta chirriante, hay que poner puerta chirriante.  Explicación resumida o subtítulo del efecto.  Descriptor temático que identifica claramente y sin ambigüedad el efecto.  Descriptor connotativo que identifica, siempre de manera subjetiva, los sentimientos que provocaría el efecto en el oyente. EN EL EXAMEN NO PRETENDE QUE NOS ESTUDIEMOS TODOS LOS CAMPOS QUE HAY AHÍ.

TEMA 5.- DOCUMENTACIÓN FOTOGRÁFICA E ILUSTRACIONES

Características de la fotografía [ 1 ]. Además de las propiedades intangibles mencionadas en el apartado anterior es necesario tener en cuenta otra serie de características que definen al documento fotográfico: Bidimensionalidad: La plasmación de una realidad tridimensional en un plano bidimensional obliga al fotógrafo a mirar desde una determinada perspectiva que, de forma intencional o, por el contrario, no deliberada, modifica necesariamente la realidad que plasma. Encuadre: La fotografía aísla y fija determinadas imágenes que quedan descontextualizadas de su entorno natural. Carácter estático: La fotografía elimina el movimiento o, en algunos casos, llega a fijar el movimiento. Estructura granular: La fotografía posee una estructura discontinua mucho más gruesa que la de la realidad, por lo que, en muchas ocasiones, no es fácil asimilar la representación fotográfica con la realidad que representa. Cromatismo: La fotografía es una representación no ya sólo de las imágenes sino también de los colores, por lo que tampoco los colores completamente fieles a los reales. Ausencia de estímulos no ópticos: En la representación de la realidad que supone la fotografía también desaparecen, con respecto a la realidad, todos los estímulos que contextualizan la imagen, en especial, los sonoros y los olfativos, aunque en algunos casos también podríamos hablar de los táctiles o, inclusive, los gustativos. Uso de la luz: La luz es uno de los elementos principales puesto que sin luz no hay fotografía y, además, la luz por sí sola es capaz de modificar el significado de una fotografía de forma que el mismo escenario puede parecer completamente distinto en función de la luz que se haya usado en ella. El análisis documental de la documentación fotográfica. Datos del análisis formal de la fotografía de prensa Autor: Autor de la fotografía. Producción/distribución: Organismo o empresa productora y/o distribuidora del documento. Fecha: De captación de la imagen original. Título: De la fotografía individual, del reportaje o serie gráfica, si lo tienen. Características técnicas del soporte: Tipo de soporte (papel, negativo,...) y dimensiones: si se conoce, se consigna también el nombre del proceso fotográfico de cara al control para la conservación Imagen electrónica: Tamaño, escala de color, origen,..., y los restantes datos del archivo. Estado de conservación: Nivel de conservación (hay que establecer una escala de conservación: buena, mala, regular, por ejemplo). Número de unidades que comprende el documento: Cuando la fotografía pertenece a un reportaje o una serie, si conocemos el dato del número total de fotografías que lo componen, podemos incluirlo. En este caso, la unidad documental sería el reportaje o la serie, y debemos rellenar también el campo siguiente. Código de reportaje o serie: Cuando decidimos que la unidad documental la compone la imagen aislada que nosotros tenemos, entonces, rellenamos este campo y no el anterior, para poder identificar la procedencia de la imagen y saber que existen otras imágenes relacionadas con la que tenemos. Fecha de realización: Fecha en la que se hace pública (mediante su plasmación en papel, en la página web si se trata de un periódico digital, etc.). Lugar geográfico: