lipn

Laboratoire d'Informatique de Paris Nord

UMR 7030, Université Paris 13, 99 avenue Jean-Baptiste Clément, 93430 Villetaneuse

up13 cnrs

Dimension Collective

 

Apprentissage Collectif

L'apprentissage collectif dans une société d'agents se distingue de l'apprentissage artificiel distribué en ce que nous donnons la priorité à la faculté pour un agent d'avoir un raisonnement, des comportements et des choix propres. Nous avons étudié un modèle d'apprentissage collectif dit apprenant-critique dans lequel une théorie courante est révisée en fonction des informations fournies par l'environnement ou les agents, de manière à satisfaire une certaine notion de consistance. Les agents prennent alors différents rôles  : apprenti (l'agent doit réviser la théorie courante pour en maintenir la consistance), ou critique (une modification de la théorie courante, proposée par un agent apprenti, est contredite par une information que possède l'agent critique).

Résultats :

  • Protocole d'apprentissage collectif par maintien de consistance pour l'apprentissage supervisé pour des représentations attribut-valeur et pour des sociétés d'agents non-individualistes maintenant ensemble une seule théorie courante [3].
  • Adaptation à des sociétés d'agents individualistes, maintenant chacun leur propre théorie courante, ce qui permet de mettre en œuvre des modes de décision collective par vote [1].
  • Proposition de protocoles permettant de maintenir les propriétés de consistance lorsque les entités ne communiquent pas toutes directement mais via un réseau de voisinage fixe ou dynamique [2].
  • Proposition de protocoles pour le cas où l'hypothèse en révision est proposée en parallèle, plutôt que séquentiellement, vers les voisins de l'agent apprenti [4].

Décision Collective

Nous avons étudié certains aspects théoriques de la décision collective, un premier problème de placement de panneaux pour canaliser des mouvements de population, et un deuxième problème de vote.

Résultats :

  • Modélisation des mouvements d'une population sous forme de chaînes de Markov. Une fois le problème de placement de panneaux démontré NP-complet, formulation et résolution sous la forme d'un problème MILP (Mixed Integer Linear Programming) [7].
  • Étude, pour différentes règles de vote, des propriétés théoriques d'un problème de vote pour lequel le nombre de candidats à une élection varie au cours de l'élection (ajout ou défection). Étude des conditions pour lesquelles le gagnant d'une élection peut changer [ 5, 6].

Références

  1. Gauvain Bourgne, Dominique Bouthinon, Amal El Fallah-Seghrouchni, and Henry Soldano. « Collaborative concept learning: Non individualistic vs individualistic agents ». In Proceedings of the 21st IEEE International Conference on Tools with Artificial Intelligence (ICTAI 2009), pages 653-657. IEEE Computer Society, 2009.
  2. Gauvain Bourgne, Amal El Fallah-Seghrouchni, and Henry Soldano. « Learning in a fixed or evolving network of agents ». In IEEE / WIC / ACM International Conference on Intelligent Agent Technology (WI-IAT 2009), pages 549-556, Milano, Italy, 2009. IEEE Computer Society.
  3. Gauvain Bourgne, Henry Soldano, and Amal El Fallah-Seghrouchni. « SMILE: Sound Multi-agent Incremental LEarning ». In International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2007), pages 164-171, Honolulu, Hawai, 2007. ACM.
  4. Gauvain Bourgne, Henry Soldano, and Amal ElFallah-Seghrouchni. « Learning better together ». In Proceedings 19th European Conference on Artificial Intelligence (ECAI 2010), volume 215 of Frontiers in Artificial Intelligence and Applications, pages 85-90. IOS Press, 2010.
  5. Yann Chevaleyre, Jérôme Lang, Nicolas Maudet, and Jérôme Monnot. « Compilation and communication protocols for voting rules with a dynamic set of candidates ». In Proceedings of the 13th Conference on Theoretical Aspects of Rationality and Knowledge, TARK XIII, pages 153-160, New York, NY, USA, 2011. ACM.
  6. Yann Chevaleyre, Jérôme Lang, Nicolas Maudet, Jérôme Monnot, and Lirong Xia. « New candidates welcome! possible winners with respect to the addition of new candidates ». Mathematical Social Sciences, 64(1):74-88, 2012.
  7. Ngoc Anh Nguyen Thi, Yann Chevaleyre, and Jean-Daniel Zucker. « Optimizing sign placements for crowd evacuation on road network in case of tsunami alert ». In Proceedings of the 21st IEEE International WETICE conference, Track on Collaborative Technology for Coordinating Crisis Management, 2012.

pres

w3c-xhtml