IRIS. Instrumentos de recogida de datos en ADSL

Hace unas semanas descubrí IRIS. Es una iniciativa de la Universidad de York que consiste en un repositorio dedicado a recopilar instrumentos, materiales y estímulos de elicitación usados en investigaciones sobre la adquisición y aprendizaje de LE.

IRIS recoge todos esos instrumentos y ha creado una base de datos en la que se pueden hacer búsquedas de acuerdo a diferentes criterios. Los recursos están publicados, en su mayoría, con una licencia Creative Commons, con lo que se puede acceder libremente a ellos y reutilizarlos en nuevas investigaciones o para la formación de investigadores.

IRIS reúne, en su base de datos, instrumentos que han sido usados en trabajos publicados en revistas previa revisión o en trabajos para la consecución de doctorado que han sido aprobados por el correspondiente tribunal. Así se asegura un mínimo de calidad. Además permite y anima a dar feedback sobre cada ítem de la base de datos con la idea de mejorar los instrumentos e iniciar una discusión científica que redunde en una mejora de los mismos.

La recogida de datos es una de las partes más difíciles, delicadas y complejas de la investigación. Es cierto que hay protocolos establecidos, pero también lo es que son muchísimos los estudios que necesitan crear un instrumento de recogida de datos ad hoc. En las publicaciones, sin embargo, sólo aparecen breves explicaciones de cómo han sido desarrollados y puestos en práctica estos instrumentos y no es común tener acceso a los datos brutos de la investigación. IRIS tiene como objetivo aumentar la transparencia en lo relativo a la recogida de datos, permitir una discusión más profunda sobre los instrumentos usados en las investigaciones y facilitar la revisión, los meta-análisis y la replicación.

Son muchos los alumnos de máster que tienen que hacer una investigación con poca o nula experiencia previa como investgiadores y precisamente el diseño de un buen instrumento de recogida de datos es una de las tareas más difíciles. En IRIS, van a encontrar un instrumento adecuado a sus objetivos de investigación, ejemplos si necesitan crear o modificar un instrumento y van a aprender cómo evaluar un instrumento de recogida de datos antes de usarlo. Los grupos de investigación profesionales podrán igualmente beneficiarse de la discusión en torno a las metodologías de recogida de datos y del incremento de la transparencia, además de colaboarar en el desarrollo de la base de datos remitiendo los instrumentos de sus trabajos y contribuyendo a la evaluación de los mismos. Los profesores que enseñan cursos de metodología encontrarán numerosos ejemplos que llevar a sus clases para usar, evaluar y analizar con sus alumnos.

Más información aquí, en este vídeo y en la web del proyecto.

 

Anuncios

Metadatos, conocimiento y Humanidades

Desde una entrada en el blog de David Weinberger he llegado a un post de Neil Jefferies publicado en Wikipedia Signpost que habla  la clasificación del conocimiento. Jefferies, hablando sobre metadatos, discute la posibilidad de que clasificaciones demasiado rigurosas limiten las posibilidades que los datos pueden ofrecer. Partiendo del hecho de que los metadatos solo tiene sentido si toman en cuenta el contexto de los datos. En la investigación en Humanidades, esto significa que los metadatos deberían dar cuenta de cosas como el tipo y la de la evidencia que aporta un dato, las controversias y opiniones diferentes.

Me ha llamado mucho la atención esta frase de Jefferies “Rather than always aiming for objective statements of truth we need to realise that a large amount of knowledge is derived via inference from a limited and imperfect evidence base, especially in the humanities. Thus we should aim to accurately represent the state of knowledge about a topic, including omissions, uncertainty and differences of opinion”. ¿No es precisamente esta la labor de la investigación en Humanidades? ¿Puede ser eso recogido por un conjunto de metadatos adjuntos a, por ejemplo, un libro o un artículo de la wikipedia?

Datos científicos abiertos

Después del movimiento a favor del libre acceso de las publicaciones científicas, parece lógico que el paso siguiente sea el de la apertura de los datos generados por las investigaciones que dan lugar a las publicaciones. La publicación es solo una parte del trabajo de investigación y tras cada proceso de investigación hay cantidades ingentes de datos que nunca llegan a ver la luz. El acceso a los datos es un paso importante para asegurar la calidad de la investigación ya que posibilitará, en teoría, que unos mismos datos sean estudiados por diferentes investigadores (replicación y verificación), que una investigación pueda incorporar datos de otros a su trabajo para completar los propios y, en definitiva, que cada investigación sea útil de la mayor cantidad de formas posibles para la mayor cantidad de gente.

En este sentido van dos iniciativas que he encontrado últimamente. Zetta Science pretende

will accelerate scientific innovation by amassing or federating the world’s most comprehensive life science scientific data, combine it with advanced semantic search and computational tools and make it openly accessible in a worldwide, cross-discipline collaborative environment (fuente)

Para conocer más del proyecto se pueden leer sus siete principios  para una ciencia abierta.

Figshare, la otra iniciativa,  consiste en un plataforma para compartir datos de investigaciones científicas. Su funcionamiento viene a ser como el de slideshare, pero en lugar de presentaciones se comparten datos científicos que están disponibles para cualquiera y que constan como publicación para los investigadores. Cada contribución cuenta con un código doi y una citación estandarizada. Esto, claro, en teoría, supongo que el reconocimiento dependerá de agencias, organismos, etc. Aquí podemos encontrar figuras, datasets completos, fotos, audios, vídeos, etc.

Según su propia definición, figsahre:

allows researchers to publish all of their research outputs in seconds in an easily citable, sharable and discoverable manner. All file formats can be published, including videos and datasets that are often demoted to the supplemental materials section in current publishing models. By opening up the peer review process, researchers can easily publish null results, avoiding the file drawer effect and helping to make scientific research more efficient. figshare uses creative commons licensing to allow frictionless sharing of research data whilst allowing users to maintain their ownership (fuente)

Nodocentrismo

Gochenour, Ph. Nodalism. 2011. Digital Humanities Quaterly, 5, 3 (enlace).

No es fácil encontrar críticas al análisis de redes que no sean una negación total del uso de la tecnología, por eso me ha interesado este artículo que rastrea la metáfora de la red y los nodos desde el pensamiento médico del siglo XIX a los discursos sobre comunicación, información y teoría de sistemas del siglo XX identificando lo que el autor llama la metáfora del nodocentrismo (nodalism, en el original inglés). El autor concluye igualando el nodocentrismo al concepto de “mito” tal y como lo entendió Barthes en las Mitologías, esto es: un discurso que se presenta a sí mismo como verdad natural olvidando su propio origen, soslayando todas las demás opciones y sirviendo a unos intereses concretos (párrafos 31-32).

Esta es una larga cita extraída del artículo:

the network as a space of pure positivity should come as no surprise, however, since it is constantly reinforced by social networking applications – there are no “enemies” on one’s Facebook profile – and social network analysis, which can only represent the efficiency of transmissions (whether of information, ideas, or disease) within a system. If a node is non-functional, or plays only a marginal role, it will either not appear within a social network analysis graph, or be pushed to the margin. This can provide significant new information about the system itself – for example, the Republic of Letters project at Stanford has provided a new understanding of the transmission of ideas by means of correspondence through Enlightenment Europe – and engender new forms of scholarship, but, in the end, such analysis can only represent agreement, since disagreement, antagonism, and conflict cannot be incorporated into the system. In his critique of humanist idealism in second-order cybernetics, Cary Wolfe makes this same point: “… Maturana and Varela’s call for an ethic of love constitutes a radical disavowal of what Ernest Laclau, Chantal Mouffe, and Slavoj Zizek have called ‘social antagonism’.” [Wolfe 2000, 190] What’s at stake in both second-order cybenernetics and the representation of the social field in social network analysis is the place of negativity; does it play its own role in establishing the social world, and, if so, how can that be expressed within nodal models of the social? The point is not to say that social network analysis is invalid, but to recognize the limitations of what it can represent, so that the representation is not taken to be the real, nor an absolute model of how the real should function (párrafos 26-27).

Notas personales:

  • El límite de los big data, a pesar de que la cantidad pase por totalidad, es que son siempre el mismo tipo de datos y son datos extraídos del mismo sitio. Simplemente hay otros datos diferentes.
  • Cierto discurso oficial y propagandístico sobre las redes ha visto en el análisis de redes la forma de describir un espacio social uniforme, idealizado, un espacio totalizante donde no cabe el desacuerdo, el disenso o el antagonismo y un instrumento para presentarlo como “la realidad”.

Otras fuentes

El artículo del que hablo es del 2011. Las mismas ideas sobre el nodocentrismo han sido desarrolladas por Ulises Mejías en otras obras. Cito de su blog:

The book situates the digital network as part of a media economy that reproduces inequality through a hegemonic–yet consensual and pleasurable–culture of participation. To support my thesis, I consider the politics of inclusion and exclusion of the network. Since in order for something to be relevant or visible within the network it needs to be rendered as a node (a phenomenon I refer to as “nodocentrism”), digital networks are constituted as totalities by what they include as much as by what they exclude.

Este extracto es un resumen de un libro de próxima aparación, pero esas mismas ideas están desarrolladas, por ejemplo, en este artículo del 2007 o esta presentación en Medialab Prado.

Igualemente la idea de leer el discurso sobre la tecnología y las redes como una “mitología” de acuerdo a la propuesta de Barthes fue sugerida por Norm Friesen en Re-Thinking E-Learning Research: Foundations, Methods and Practices. Peter Lang Nueva York (p. 173 y ss.) del año 2009.

Ninguna de las dos fuentes es citada en el artículo de Gochenour. Las señalo para tenerlas presentes.

Spanish learner language oral corpus (SPLLOC)

logoHace unos meses me llegó información sobre la página del Spanish learner language oral corpus (SPLLOC). Es un corpus con producciones orales de aprendices de español. Está disponible el audio y la transcripción. Los aprendices son estudiantes de español cuya primera lengua es el inglés desde niveles iniciales hasta avanzados. Las grabaciones se han hecho mediante diversas técnicas de elicitación que están detalladas en la página. El contenido de la página también está disponible vía CHILDES Y TALKBANK. El corpus es accesible a todo el mundo y los investigadores que lo deseen pueden usarlo para sus trabajos citando las fuentes oportunamente. Todo se explica en la página.

El único pero es que las grabaciones no recogen el discurso oral de los alumnos tal y como se produce en el aula. Aunque las técnicas de elicitación sí son consecuentes con los objetivos de investigación del proyecto. En definitiva una página con mucho material de interés para investigadores.