1 / 45

Information Science 2005

Information Science 2005. Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www.scils.rutgers.edu/~tefko. Organizaci ó n de la presentaci ó n. El paisaje – problemas , soluciones, lugar social

nijole
Télécharger la présentation

Information Science 2005

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www.scils.rutgers.edu/~tefko

  2. Organización de la presentación • El paisaje – problemas, soluciones, lugar social • Estructura –áreas principales de investigación y práctica • Tecnología – Recuperación de la información – la mayor parte • Información – representación; bibliometría • Gente – usuarios, uso, búsqueda, contexto • Ruptura paradigmática– distanciamiento de las áreas de investigación • Bibliotecas digitales – ¿de quiénes son? • Conclusiones– grandes cuestiones para el futuro

  3. Parte 1. El gran paisajeProblemas abordados • Un poco de historia: Vannevar Bush (1945): • Definió el problema como“... La tarea masiva de hacer más accesible el enorme repositorio del conocimiento.” • Un problema que sigue con nosotros y sigue creciendo. Tabla de contenidos

  4. … solución • Bush sugirió una máquina: “Memex ... Asociación de ideas … que duplique los procesos mentales artificialmente.” • Una solución tecnológica al problema • Todavía con nosotros: determinante tecnológico

  5. En la base de la Ciencia de la Información: un problema Intentar controlar el contenido en: • La explosión de la información • El crecimiento exponencial de los artefactos informativos, si no de la propia información Y hoy ADEMÁS • La explosión de la comunicación • El crecimiento exponencial de los medios y modos de comunicación, transmisión, acceso y uso de la información

  6. Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información PERO: Desde una perspectivaHUMANA & SOCIAL Y no solo TECNOLOGICA solución tecnológica, PERO …

  7. Gente Información Tecnología o un modelo simbólico

  8. Problemas & soluciones:CONTEXTO SOCIAL • Práctica profesional E investigación científica relacionada con: Comunicación efectiva de los registros del conocimiento - ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales • Con la ventaja de las nuevas tecnologías de la información

  9. Características generales • Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes • Imperativo tecnológico - fuerza impulsora como en muchos campos modernos • Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos Tabla de contenidos

  10. Parte 2. EstructuraComposición del campo • Como muchos campos, la ciencia de la información tiene muchas áreas diferentes de concentración y especialización • Que cambian y evolucionan a lo largo de tiempo • se acercan y se separan • se ignoran, más o menos, entre sí

  11. más importante aún, las diferentes áreas… • reciben más o menosfinanciación & énfasis • produciendo grandes desequilibrios en el trabajo y el progreso • atrayendo diferentes audiencias y campos • esto incluye • vastas diferencias en los niveles de soporte para la investigación e • inversiones y aplicaciones enormes en el campo comercial

  12. Información o Gente o ¿Cómo encontrar una estructura? descomponiendo áreas y esfuerzos en la investigación y práctica, enfatizando Tecnología Tabla de contenido

  13. Parte 3. Tecnología • Identificada con la recuperación de información (RI) • con mucho se lleva los mayores esfuerzos e inversiones • es internacional y global • los intereses comerciales subyacentes son grandes y crecientes

  14. Recuperación de información – definición & objetivo “ RI: ... aspectos intelectuales de la descripción de información, ... búsqueda, ... & sistemas, máquinas...” Calvin Mooers, 1951 • ¿Cómo proporcionar a los usuarios información relevante de forma efectiva? Para ese fin: 1. ¿Cómo organizar la información intelectualmente? 2. ¿Cómo especificar la búsqueda & la interacción intellectualmente? 3. ¿Qué técnicas & sistemas usar efectivamente?

  15. Investigación contemporánea en RI • Ahora principalmente dentro de la Informática • e.g Special Interest Group on RI, Association for Computing Machinery (SIGIR,ACM) • Extendida globalmente • v.g. grandes comunidades de investigación han emergido en China, Corea y Singapur • Sacada fuera de la Ciencia de la Información - “todo el mundo hace recuperación de información” • minería de datos, aprendizaje automático, procesamiento del lenguaje natural, inteligencia articial, gráficos por ordenador …

  16. Text REtrieval Conference (TREC) • Principal esfuerzo de investigación experimental • Comenzó en 1992, ahora probablemente terminando • “para soportar la investigación de la comunidad RI proporcionando la infraestructura necesaria para la evaluación en gran escala” • Métodos • proporciona grandes bases de documentos, consultas, juicios de relevancia y análisis comparativos • usando esencialmente la metodología que uso Cranfield en los sesenta • organizada en varios temas que han ido evolucionando

  17. El impacto de TREC • Internacional – gran impacto en crear comunidades de investigación • Conferencias anuales • informes, intercambio de resultados, cooperación • Resultados • principalmente en informes, disponibles en http://trec.nist.gov/pubs.html • estados de la cuestión • pero solo una parte publicada en revistas y libros

  18. Genómicacon 4 sub líneas HARD (High Accuracy Retrieval from Documents) Novelty (nueva información no redundante) Respuestas a consultas Robust (mejorando temas en los que la recuperación es deficiente) Terabyte (colecciones muy grandes) Web Líneas anteriores: ad-hoc (1992-1999) routing (92–97) interactive (94-02) filtering (95-02) cross language (97-02) speech (97-00) Spanish (94-96) video (00-01) Chinese (96-97) query (98-00) y unas pocas más que solo tuvieron dos años de duración Líneas TREC 2004103 grupos de 21 países

  19. Ampliación del RI – siempre cambiando y con nuevas áreas añadidas • RI a través de diferentes idiomas (CLIR) • Procesamiento del lenguaje natural (NLP RI) • RI de música (MIR) • Imagen, vídeo y multimedia • Lenguaje oral • RI en Bioinformática y Genómica • Resumen; extracción de texto • Respuesta de consultas • Interacción hombre/máquina • XML RI • RI en la Web; buscadores web • RI en contexto – gran área para los grandes buscadores e investigación más reciente

  20. RI comercial • Buscadores basados en la RI • Pero añadiendo muchas elaboraciones e innovaciones significativas • gestionando enormes cantidades de páginas rápidamente • interesantes juegos de algoritmos de spamming & page rank –IR competitivo- combate de algoritmos • incluyendo el contexto en la búsqueda • Extensión e impacto mundial • unos 2000 buscadores en más de 160 países • El inglés fue dominante, pero ya no

  21. RI comercial : “un mundo feliz” • Grandes inversiones & sector económico • Esperanzas de grandes beneficios, aunque todavía cuestionables • Conduce a RI propietaria y secreta • Con un fichaje agresivo de los mejores talentos • Nuevos centros comerciales de investigación en diferentes países (v.g. MS en China) • La financiación de la investigación académica está cambiando • Fuga de cerebros de la academia • Los motores de búsqueda comerciales tienen que hacer frente a grandes retos • Perspectiva de: Amit Singhal

  22. La RI puso en marcha con éxito • La emergencia y desarrollo de la INDUSTRIA de la información • La evolución de la CI como PROFESIÓN y CIENCIA • Muchas APLICACIONES en muchos campos • Incluyendo la Web – motores de búsqueda • Mejoras en la INTERACCIÓN PERSONAS - COMPUTADORAS • La evolución de la INTEDISCIPLINARIEDAD La RI tiene una larga y orgullosa historia Tabla de contenidos

  23. Parte 4. Información • Varias áreas de investigación • Como un fenómeno básico – no demasiado progreso • Medidas como las de Shannon no han tenido éxito • Concentrada en sus manifestaciones y efectos • No hay progreso reciente en este tema de investigación básica • Representación de la información • Gran área conectada con RI, biblioteconomía • Metadatos • Bibliometría • Estructuras de la literatura

  24. ¿Qué es la información? Bien comprendida intuitivamente, pero mal formulada formalmente • Han emergido varios puntos de vista y modelos • Shannon: fuente - canal -destino • señales no son contenido – no es realmente aplicable, a pesar de muchos intentos • Cognitivo: cambios en las estructuras cognitivas • Procesamiento y efectos del contenido • Social: contexto, situación • Búsqueda de información, tareas

  25. La información en la Ciencia de la Información:Tres sentidos(del más estrecho al más amplio) • información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos • señales, bits, datos simples - v.g.. Teoría de la Información (Shanon), Economía, • información incluyendo el procesamiento cognitivo y la comprensión • comprensión, emparejamiento de textos, Brookes • información también en relación al contexto, la situación, el problema a resolver • USUARIOS, USO, TAREA Para la Ciencia de la Información (incluyendo la recuperación de información): la tercera interpretación, la más amplia, es necesaria

  26. Parte 5. Gente • Servicios profesionales • en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva • en la industria – vendedores, agregadores, Internet, • Investigación • Usuarios & estudios de usuario • Estudios de interacción • Ampliando el campo a los estudios de búsqueda de la información, contexto social, colaboración • Estudios de relevancia • Social informatics

  27. Uso y estudios de usuarios • El área más antigua • cubre muchos temas, métodos y orientaciones • muchos estudios están relacionados con la RI • v.g. búsqueda, multitarea, visualización, navegación • Introduciéndose en los estudios de usuarios de la web • Estudios cuantitativos y cualitativos • Emergencia de la webmetría

  28. Interacción • El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción • Diversos modelos de interacción han sido sugeridos • Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model • Difícil de realizar experimentos y de confirmarlos • Se consideran clave para proporcionar • las bases de un diseño mejor • la comprensión sobre el uso de los sistemas • Las interacciones en la Web: una nueva área clave

  29. Búsqueda de información • Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo • Ha proporcionado varios modelos • v.g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas de Järvelin • Incluye estudios sobre la vida real, construcción del sentido, localización de la información, vida laboral, descubrimiento de información • Basado en el concepto de la construcción social de la información Tabla de contenidos

  30. Parte 6. Ruptura del paradigma entre sistemas y gente • Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques: centrado en los sistemas • algoritmos, TREC, motores de búsqueda • continua el modelo tradicional de RI centrado en los humanos (usuarios) • cognitivo, situacional, estudios de usuarios • modelos de interacción, algunos comenzados en TREC

  31. Lado humano vs. sistema • Lado humano (usuario) : • a menudo crítico, incluso unilateral • propone un mantra de implicaciones para el diseño • pero no proporciona resultados en la práctica • Lado del sistema: • ignora los estudios H • ‘dinos que hacer y lo haremos’ • El tema NO es H o S • ni siquiera menos H vs. S • sino como pueden H y S trabajar juntos • uno de los principales retos para el futuro

  32. Llamadas vs soporte • Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano • Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas • Sin embargo, la mayor parte del soporte se va al trabajo de sistemas • en la era digital el soporte es para lo digital • Un intento reciente de combinar ambas perspectivas: Book: Ingerwersen, P. and Järvelin, K. (2005). The turn: Integration of información seeking and retrieval in context. Springer. Tabla de contenidos

  33. Parte 7.Bibliotecas digitales • Área ENORME & creciente • Área “caliente” in I&D • con un número importante de becas y proyectos en los EE. UU., Europa y otros países • pero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño • Área “caliente” en la práctica • Se están construyendo colecciones digitales y bibliotecas híbridas • Existen muchos proyectos por todo el mundo

  34. Problemas técnicos • Sustanciales - mayores y más complejos que lo anticipado: • representación, almacenamiento y recuperación de los objetos bibliotecarios digitales • particularmente si fueron originalmente diseñados para ser impresos y luego se digitalizaron • gestionar operacionalmente grandes colecciones - temas de escala • tratar con colecciones diversas y distribuidas • interoperabilidad • asegurar la preservación y la persistencia • incorporar la gestión de derechos

  35. EEUU: Digital Library Initiatives • Consorcios dependientes de la financiación de la National Science Foundation • DLI 1: 1994-98, 3 agencias, $24M, 6 grandes proyectos • DLI 2: 1999-2006, 8 agencias, $60+M, 77 proyectos grandes y pequeños en varias categorías • proyectosinternacionales conjuntos • National Science, Mathematics, Engineering, and Technology Education Digital Library • cerca de 200 proyectos de demostración & desarrollo • La financiaciónterminada en 2005 • ahora desviada a áreas relacionadas

  36. Unión europea: DELOS • DELOS Network of Excellence on Digital Libraries • muchos proyectos a lo largo de la Unión Europea • de carácter muy tecnológico • muchas reuniones y talleres • hasta cierto punto recuerda a las DLIs de los EE. UU: • bien financiados, a largo plazo • a diferencia de lo que ocurre en los EE. UU. el soporte continúa

  37. Temas de investigación • comprender los objetos en las BD • representados en muchos formatos • metadatos, catalogación, indización • conversión, digitalización • organización de grandes colecciones • gestión de colecciones, escalamiento • preservacion, archivo • interoperabilidad, estandarización • acceso, uso, búsqueda • búsqueda federada en colecciones distribuidas • evaluación de bibliotecas digitales

  38. Proyectos de BD en la práctica • Muy orientados a las instituciones y sus misiones • en bibliotecas, pero también en otras • museos, sociedades, gobiernos, empresas • en muchas variantes • Extendidos globalmente • incluyendo la digitalización • U California, Berkeley’s Libweb“lista más de 7300 páginas de bibliotecas de más de 125 países” • Extendiéndose a gran velocidad • a menudo a costa de otros recursos

  39. ¿En conexión? • La investigación y la práctica actual en BD son desarrolladas actualmente • mayormente de forma independiente una de otra • informando mínimamente a la otra parte • y con una conexión mútua ligera o inexistente • Son en el momento actual universos paralelos con escasas conexiones e interación • no es bueno ni para la investigación ni para la práctica Tabla de contenido

  40. Parte 8. ConclusionesLas contribuciones de la CI • Puso en marcha la gestión de la información en la sociedad • Desarolló un cuerpo organizado de conocimiento y de competencias profesionales • Aplicó la interdisciplinariedad • Alcanzó un estado de madurez • penetró muchos campos y actividades humanas • Acentuó el factorHUMANO en la interacción hombre-máquina

  41. Retos • Ajustarse al papel organizacional y social creciente y cambiante de la información y de la infraestructura informacional relacionada • Jugar un papel positivo en la globalización de la información • Responder al imperativo tecnológico en términos humanos • Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación • convirtiendo las propias experiencias en soluciones, especialmente en el campo de la web • Unir competitividad y calidad • Reunir lo DIGITAL con las BIBLIOTECAS

  42. Momento crítico • La CI está en un momento crítico de su evolución • Muchos grupos y campos… se están desplazando al campo de la información • fuerte competencia • entrada de jugadores poderosos • lucha por el control • Para ser un jugador de primera, la CI necesita progresar en: • investigación & desarrollo • competencias profesionales • esfuerzos educacionales • relaciones interdisciplinares • Es necesaria una re-examinación

  43. Gracias Miró!

  44. Gracias Thank you Hvala Danke Merci Grazie

  45. Bibliografía Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science,50, 1043-1050. Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101-108. Available: http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501-531. Pettigrew, K.E. & McKechnie, L.E.F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73. Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051-1063. Available: http://www.scils.rutgers.edu/~tefko/JASIS1999.pdf Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http://www.scils.rutgers.edu/~tefko/DL_evaluation_LIDA.pdf Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311-330. White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972-1995. Journal of the American Society for información Science, 49 (4), 327-355.

More Related