RESEARCH IN RESIDENCE
Projet BOUM de la SMAI
Species sampling-inspired network models
Modèles de réseau inspirés de l’échantillonnage d’espèces
8 – 12 June, 2026
Participants
Louise Alamichel (Bocconi University)
Tâm Le Minh (INRIA, Université de Grenoble)
Interaction networks capture relational data (edges) between entities (nodes). Probabilistic model-based approaches are versatile and well-suited for statistical network analysis, describing the generative process while accounting for random variability. Most commonly used models, such as the stochastic block model for community detection, assume node-exchangeability. However, interaction networks are typically constructed by sampling edges rather than nodes.
The less frequently studied edge-exchangeable models are more appropriate in this context, as they treat sampled interactions rather than nodes as the statistical units. This can be reframed as a species sampling problem, where observations consist of sampled species pairs (node labels). Few studies have explored edgeexchangeable network models based on species sampling models (SSMs), and most assume the two nodes per edge are sampled conditionally independently, an often unrealistic assumption.
This project aims to propose a generic class for edge-exchangeable models based on dependent SSMs, incorporating node dependencies within each edge, along with associated theory and computational methods for inference. This would provide a new framework for statistical network analysis, allowing community detection, hypothesis testing, link prediction, and inference of unobserved nodes. In the near future, we aim to apply these models to ecological networks, which describe interactions between species. Analyzing their structure and variability can offer insights into ecosystem responses to external factors.
Les réseaux d’interaction représentent des données relationnelles (arêtes) entre des entités (nœuds). Les approches probabilistes basées sur des modèles sont versatiles et bien adaptées à l’analyse statistique des réseaux, car elles décrivent leur processus génératif tout en tenant compte de la variabilité aléatoire. Les modèles les plus couramment utilisés, tels que le modèle à blocs stochastiques pour la détection de communautés, supposent l’échangeabilité des nœuds. Cependant, les réseaux d’interaction sont généralement construits en échantillonnant des arêtes plutôt que des nœuds.
Les modèles basés sur l’échangeabilité des arêtes sont moins étudiés, mais plus appropriés dans ce contexte, car ils considèrent les interactions échantillonnées, plutôt que les nœuds, comme unités statistiques. Cela peut être reformulé comme un problème d’échantillonnage d’espèces, où les observations consistent en des paires d’espèces échantillonnées (étiquettes de nœuds). Peu d’études ont exploré les modèles de réseaux à arêtes échangeables basés sur les modèles d’échantillonnage d’espèces (SSMs), et parmi ceux-là, la plupart supposent que les deux nœuds de chaque arête sont échantillonnés de manière indépendante, une hypothèse souvent irréaliste.
Ce projet vise à proposer une classe générique de modèles à arêtes échangeables fondée sur des SSMs dépendants, incorporant des dépendances entre les nœuds de chaque arête, ainsi qu’un cadre théorique et des méthodes computationnelles assorties pour l’inférence. Cela offrirait un nouveau cadre pour l’analyse statistique des réseaux, permettant la détection de communautés, les tests d’hypothèses, la prédiction de liens, et l’inférence
sur des nœuds non observés. Par la suite, nous visons à appliquer ces modèles aux réseaux écologiques en premier lieu, qui décrivent des interactions entre espèces. L’analyse de leur structure et de leur variabilité pourrait fournir des informations précieuses sur la réponse des écosystèmes aux facteurs externes.
SPONSOR
