Si notre habitude de collecter des données authentiques, de les organiser de façon rationnelle et de les partager avec nos pairs a probablement fait progresser la recherche ces dernières décennies, il nous faut cependant rester humbles quant à ce qu’un corpus peut nous apprendre. D’abord, la linguistique dite « de corpus » cultive parfois une fascination pour les phénomènes attestés, nous conduisant ainsi à négliger ceux qui ne le sont pas. Or, comme Bloomfield dans ses postulats, je crois que c’est l’ensemble des possibles qui nous intéresse dans l’étude du langage humain, et pas seulement celui des phénomènes effectivement constatés. Ensuite, il arrive qu’à trop vouloir se focaliser sur les données, on oublie de formuler explicitement des prédictions en amont d’un travail empirique. Or, et a fortiori quand on réutilise un corpus collecté pour d’autres besoins (l’open data n’a pas que des avantages), le risque d’aboutir à de fausses interprétations ex post facto n’est pas négligeable. Le monde grouille en effet de corrélations fortuites ; ce n’est pas un hasard si les philosophes des sciences, comme Popper dans sa méthode hypothético-déductive, insistent sur la préséance de la formulation d’une hypothèse sur le test empirique ad hoc de celle-ci. Enfin, si, comme le proposent les modèles usage-based, nos représentations sont le résultat d’un apprentissage statistique qui garde une trace détaillée de tout ce que nous avons été amenés à entendre, alors sonder ce « corpus mental » – pour reprendre l’expression du linguiste John R. Taylor – au moyen de méthodes éprouvées en psycholinguistique et neurosciences permet sûrement d’aller au-delà de simples enregistrements audio du corpus phonétique/phonologique typique. Les 25 années que je viens de passer à faire de la phonétique m’ont conduit à une très nette préférence pour les approches expérimentales par rapport à la réutilisation de corpus préexistants ou l’enregistrement de données audio suivant un protocole qui n’aurait pas été spécialement conçu pour ma question de recherche. A l’aide d’exemples, et notamment des limites constatées dans ma propre recherche, j’espère montrer ce qui m’a conduit à préférer l’expérimentation.