jeudi 18 mai 2017

Thèse : Etude du Service Function Chaining (SFC) dans un contexte multi-domaines F/H





Ref : 0016122 | 15 mai 2017
Date limite de candidature : 31 juil. 2017
Route de Perros Guirec 22300 LANNION - France

Votre rôle

Vous trouverez ci-dessous la description du contexte de ce travail de recherche.
La mission et les principaux objectifs scientifiques seront précisés sous le titre "Entité".
La virtualisation des fonctions réseau ou Network Function Virtulaization (NFV) [1] consiste à extraire les fonctions réseaux fonctionnant sur un équipement physique dédié (ex. routeurs, firewall, etc.), pour les exécuter dans un environnement virtualisé (i.e. Machine Virtuelle ou centenaire), et les déployer dans des centres de données (Data Centres - DC). Le concept NFV couvre la virtualisation des fonctions de routage mais aussi les fonctions réseau qui sont généralement déployées dans des middlebox, tel que firewall, détection d'intrusion, proxy TCP, etc. Couramment, le trafic issu d'une application doit passer par un ensemble de VNF, dans un ordre prédéfinis, afin d'appliquer une politique de sécurité ou définir une route overlay. Dans ce contexte, une Service Function Chaining (SFC) indique explicitement l'ordre et le type de service (sous forme de VNF) à utiliser pour appliquer une politique de traitement pour un trafic applicatif donné. Un SFC est défini par un opérateur pour un trafic ou un ensemble de trafic, et déployé dans le réseau par le biais d'un contrôleur SDN, en utilisant des entêtes orientés service (Network Service Header [2]), à insérer dans les paquets générés par l'application. Le trafic est par la suite acheminé par les éléments de forwarding afin de suivre un chemin overlay pour visiter plusieurs VNF (service), même si ces derniers ne sont pas dans le même DC. L'émergence du concept « Network Slicing » (i.e. Réseau virtuel) dans les réseaux 5G, a consolidé le principe de SFC, vu qu'un Slice réseau regroupe un ensemble de VNFs, hébergés dans des DC, interconnectés ensemble, créant une SFC. Dans le cadre du « Network Slicing » une SFC est créée par un orchestrateur de service comme définie dans [3].
Les travaux de recherche existant sur SFC couvrent des méthodes et des solutions pour définir, créer et déployer un SFC sur plusieurs DCs appartenant au même domaine administratif (c-à-d, gérer par le même opérateur).
Etat de l'art :
Outre le standard IETF [4] et les travaux de recherche résumés dans [3], il existe beaucoup de travaux concernant l'instanciation de SFC mono domaine [6] ; mais aussi des solutions pour créer le réseau overlay de la SFC, tel que l'extension pour le contrôleur SDN ODL [6] conjugué avec OVS [7]. De plus, il existe des solutions industrielles comme celle de CISCO [8]. Cependant, une chaine SFC peut nécessiter un déploiement sur plusieurs domaines administratifs. Par exemple, un slice réseau peut nécessiter le déploiement d'une SFC sur plusieurs domaines afin de déployer un service de bout-en-bout. Par conséquent, il est important de disposer d'un mécanisme permettant d'assurer le déploiement de SFC sur plusieurs domaines afin de garantir la création de services bout-en-bout dans les réseaux 5G et ceux basés sur le principe NFV.
Une approche pour le déploiement d'une SFC multi-domaines peut consister en l'utilisation de solutions utilisées pour résoudre le problème dit «Multi-domain virtual network embedding » [9][10]. La majorité des solutions [11], cependant, requièrent une vision globale (cartographie) sur le réseau et ses ressources afin de mapper les ressources virtuelles et physiques sur plusieurs domaines. Or, avoir une cartographie du réseau est quasi-impossible dans le cas multi-domaines, vu que les opérateurs n'affichent pas ce type d'informations pour des raisons de sécurité et de confidentialité. De plus, une SFC se distingue du « Multi-domain virtual network embedding » par le type de topologie qui est linéaire dans le cas SFC et l'ordre des VNF dans la SFC, qui peut être flexible.

Votre profil

Vous êtes diplômé(e) d'un Master 2 ou d'une école d'ingénieur informatique-télécom.
Compétences et qualités personnelles souhaitées :
  • Une bonne maitrise des architectures réseaux
  • Une bonne connaissance des systèmes virtualisés
  • Un très bon relationnel et travail en équipe
Vous avez idéalement une expérience dans le domaine de la virtualisation des réseaux et plus précisément les architectures type NFV.

Le plus de l'offre

Au sein de la direction "Wireline Networks and Infrastructure", le département « IP Networks, Monitoring and Security (IPN) » est en charge de la définition et le pilotage de la stratégie d'évolution du domaine IP vers des réseaux de 5ième génération convergents. L'une des missions du département étant d'assurer la transformation du domaine IP au travers de la softwarisation et de l'automatisation des fonctions et réseaux IP (interfaces nord des matériels et logiciels, solutions IPSDN).
Vous travaillerez dans un environnement multiculturel, au sein d'une entité à la pointe de l'innovation. Le sujet vous permettra également de vous familiariser avec les problématiques autours de la virtualisation et le déploiement automatique des fonctions réseau actuellement en plein essor.
Références :
[1] “Network functions virtualisation (NFV); architectural framework,” ETSI GS NFV 002 v1.1.1, Oct. 2013.
[2] P. Quinn and J. Guichard “Service Function Chaining: Creating a Service Plane via Network Service Headers”, in IEEE Computer 2014 Vol. 14, Issue 11.
[3] A.M. Medhat, T. Taleb, A. Elmangoush, G. Carella, S. Covaci, and T. Magedanz, “Service Function Chaining in Next Generation Networks: State of the Art and Research Challenges," to appear in IEEE Communications Magazine, 2017, Volume 55, Issue 2.
[4] “Service Function Chaining (SFC) Architecture”, RFC 7665, IETF, Oct. 2015.
[5] OpenStack SFC, https://docs.openstack.org/developer/networking-sfc/
[6] Open Day Light SFC, https://wiki.opendaylight.org/view/Service_Function_Chaining:Main
[7] SFC with NSH and OVS - Open vSwitch, http://openvswitch.org/support/ovscon2015/16/1040-elzur.pdf
[8] “Implementing NSH Based Service Chaining”, Cisco white paper available at http://www.cisco.com/c/en/us/td/docs/routers/asr9000/software/asr9k_r6-1/addr-serv/configuration/guide/b-ipaddr-cg-asr9k-61x/b-ipaddr-cg-asr9k-61x_chapter_01110.pdf
[9] I. Vaishna, R. Guerzoni, and R. Trivisonno, “Recursive, hierarchical embedding of virtual infrastructure in multi-domain substrates,” in Proceedings of the 1st IEEE Conference on Network Softwarization (NetSoft), London, UK, April, 2015.
[10] D. Dietrich, A. Rizk, and P. Papadimitriou, “Multi-Domain Virtual Network Embedding with Limited Information Disclosure,” in Proceedings of IFIP Networking Conference, Brooklyn, NY, May 2013.
[11] M. Chowdhury, F. Samuel, and R. Boutaba, “Polyvine: policy-based virtual network embedding across multiple domains,” In Proceedings of the 2nd ACM SIGCOMM Workshop on Virtualized Infrastructure Systems and Architec-tures, New York, NY, 2010, pp. 49-56.
[12] W. Saad, Z. Han, M. Debbah, A. Hjorungnes and T. Basar, “Coalitional game theory for communication ne
[13] Brief tworks”, in IEEE Signal Processing Magazine, vol. 26, no. 5, pp. 77-97, September 2009.
[14] Bagpipe https://docs.openstack.org/developer/networking-bgpvpn/bagpipe/
[15] Introduction to Reinforcement Learning, http://www.cs.ubc.ca/~murphyk/Bayes/pomdp.html
[16] OpenStack, https://www.openstack.org/
[17] ONOS, onosproject.org/

Entité

Objectif scientifique de la thèse
Nous allons étudier et proposer des solutions à la problématique de composition, déploiement et gestion de chaines SFC sur plusieurs domaines administratifs. Les verrous à lever sont les suivants :
1- La définition et la composition optimale d'une SFC. Dans le contexte multi-domaines le manque d'information sur les ressources limitera l'optimalité du choix des VNF composant la SFC et leur placement. En effet, le choix optimal dépendra de plusieurs critères, qui sont en relation avec les objectifs de l'opérateur; eg. le coût des VNF, la QoS à fournir, etc. Pour résoudre ce problème, on étudiera les différentes techniques multicritères pour le placement de VNFs sur plusieurs domaines. Outre les méthodes d'optimisation combinatoire qui peuvent ne pas être efficaces pour le cas multi-domaines, on s'intéressera aux techniques basées sur la théorie des jeux, et plus précisément, les algorithmes de type « Coalition Games » [12].
2- Le déploiement dans le réseau. Une SFC est déployée dans le réseau par le biais d'un réseau overlay utilisant les en-têtes spécifiques NSH, pour acheminer les paquets vers les VNFs. Sachant que la création et le déploiement de SFC doit être dynamique et à la demande, le SDN est utilisé pour créer l'en-tête NSH par le biais de règles OpenFlow, poussés vers les équipements du réseau [2]. Cependant, ce principe fonctionne très bien pour les réseaux appartenant au même domaine, mais il n'est pas adapté lorsque les VNFs sont à déployer sur plusieurs domaines. De ce fait, on s'intéressera à la problématique de la mise en place, couvrant le plan de contrôle et le plan de données. Ceci passe par la définition de solutions basées sur l'interconnexion des contrôleurs SDN de chaque . De plus, à l'image de ce qui a été proposé dans [14], nous étudierons la possibilité de rajouter des extensions au plan de transfert IP/MPLS, pilotable par un contrôleur SDC, afin d'assurer une interopérabilité avec les réseaux underlay existant.
3- Après le déploiement d'une SFC, il est nécessaire de garantir son optimalité en termes de performances. En effet, on étudiera et on proposera des techniques d'adaptation de ressources SFC aux changements spatio-temporelles, causés par exemple par la mobilité des utilisateurs, ou la dégradation de la QoS offert par une partie des VNFs appartenant à la SFC. Plus précisément, on envisagera des solutions réagissant à des évènements (changement de qualité ...), par l'exécution d'actions, tel que la demande de migration des VNFs vers des machines ou des domaines plus performants. Les solutions proposées pourront être améliorées avec des techniques de « Reinforcement Learning » [15] afin de prédire les événements et anticiper les actions pour optimiser les performances d'une SFC.
Approche méthodologique-planning
La thèse se déroulera en deux phases. La première phase sera consacrée à l'étude de l'état de l'art sur SDN, NFV et SFC. Particulièrement, cette étape devra clairement identifier les challenges (architecture, composition, réseau), associés au déploiement de chaines SFC multi-domaines. La deuxième phase de la thèse sera consacrée à la proposition d'algorithmes et de solutions afin de déployer une chaine SFC multi-domaines, en traitant les verrous cités dans la section précédente. Les performances des solutions proposés devront être évalués via des modèles analytiques et la simulation informatique. Des preuves de concept vont être développées afin de démontrer la faisabilité des solutions proposées en utilisant des outils open sources tel que OpenStack [16] et ONOS [17].

Contrat

Thèse

Thèse : Algorithmes d'apprentissage machine appliqués au contexte dynamique de l'internet des objets F/H





Ref : 0016120 | 15 mai 2017
Date limite de candidature : 31 juil. 2017
28 chemin du Vieux Chene 38240 MEYLAN - France

Votre rôle

Vous trouverez ci-dessous la description du contexte de ce travail de recherche.
La mission et les principaux objectifs scientifiques seront précisés sous le titre "Entité".
La croissance exponentielle du nombre d'objets connectés attire de plus en plus l'attention sur leur incapacité à répondre aux exigences spécifiques des communications Machine-to-Machine (M2M).
Le modèle de trafic de ce type de communications consite en un grand nombre d'objets transmettant sporadiquement des paquets réduits. Il est à l'opposé du modèle actuel réalisé dans les réseaux classiques. Les objets devant répondre à des durées de vie sur batterie de plusieurs années, ils ont ainsi des contraintes très fortes en termes de consommation d'énergie. La supervision de ces réseaux fait donc appel à des solutions particulières.
Récemment un tableau de Bord Intelligent pour la supervision des réseaux IoT a été développé par Orange Labs Meylan.
Il permet la supervision d'indicateurs de performances (KPIs) et de respect des contrats sur les niveaux de services (SLAs) définis pour les clients Grands Comptes dans le domaine de l'IoT.
Cet outil est bien adapté pour des envois périodiques (le « smart metering » étant un exemple typique).
Cependant, dans le contexte d'un réseau générique IoT, tels que les réseaux LoRa ou LTE-M, qui sont utilisés pour des clients multiples et des services divers et variés avec le même réseau, Il est nécessaire d'adapter l'outil de mesure de performance à la variété des usages possibles.
Il est notamment nécessaire d'identifier les indicateurs les plus pertinents afin de mesurer de manière fiable les différents KPIs client dans cet environnement complexe.
Lors du développement de ce tableau de bord, quelques techniques simples de "Machine Learning" ont été expérimentées. Les premiers résultats sont très encourageants aussi bien du point de vue de l'analyse d'anomalies que de celui de la maintenance prédictive.
Etat de l'art :
Dans leur « Survey » "A Data-Centric View of the Internet of Things", Y.Qin et al. [3] ont souligné qu'en plus du volume de données, un réseau IoT se caractérise par la redondance, l'incertitude et l'incohérence des données.
En effet, les données issues d'un objet pourraient être manquantes, dupliquées ou incohérentes [3] lorsque plusieurs capteurs déclarent des valeurs potentiellement en conflit sur l'état du même élément de l'environnement.
Un autre aspect de l'IoT est la nature distribuée de l'architecture associée. Cette architecture distribuée va souvent de pair avec un environnement dynamique [3] et une topologie qui évolue dans le temps [4]. De ce fait, C.W.Tsai et al. [4] observent que la plupart des outils de data mining ne peuvent être appliqués directement à l'IoT et que le recours à des algorithmes dynamiques est nécessaire. Les modèles utilisés pour l'IoT doivent en effet pouvoir s'adapter à des caractéristiques des données variables. Il faut notamment tenir compte du « concept drift » ou dérive conceptuelle : les significations statistiques de la variable cible peuvent évoluer au cours du temps d'une manière imprévue.
Dans notre cadre, cette évolution peut résulter de divers facteurs tel que des changements dans l'environnement, le vieillissement des objets ou l'évolution des logiciels sur les noeuds du réseau.
Points de recherche à traiter:
  • évaluation des modèles de ML (Machine Learning) permettant de prédire la norme du comportement large échelle des noeuds IoT
  • détection d'évolution du type « concept drift » ou dérive conceptuelle : quelles sont les variables en cours d'évolution, et de quelle manière les interpréter ?
  • Anonymisation et imputation/affectation de données masquées ou altérées à des fins de protection de la vie privée

Votre profil

Vous êtes diplômé(e) d'un Master de recherche.
Compétences et qualités personnelles souhaitées :
  • Très bonnes connaissances en statistiques et en Machine Learning,
  • Compétences en développement logiciel dans l'enviroment BigData,
  • Curiosité,
  • Autonomie, rigueur,
  • Bonne expression écrite en anglais (publications internationales).

Le plus de l'offre

Cette thèse est à la fois un travail sur les aspects recherche de stream data mining et sur des data sets réels de l'IoT. Vous contribuerez à un projet open source Apache.
Il est en outre prévu de contribuer au projet open source Samoa afin de le rendre "full-fledged » projet Apache. Un projet collaboratif Européen a été déposé sur ce sujet.
Références :
[1] N. A. Ali and M. Abu-Elkheir. Data management for the internet of things: Green directions. In 2012 IEEE Globecom Workshops, pages 386-390, Dec 2012.
[2] G. Ditzler, M. Roveri, C. Alippi, and R. Polikar. Learning in nonstationary environments: A survey. IEEE Comp. Int. Mag., 10(4):12-25, 2015.
[3] Y. Qin, Q. Z. Sheng, N. J. Falkner, S. Dustdar, H. Wang, and A. V. Vasilakos. When things matter. A survey on data-centric Internet of Things. J. Netw. Comput. Appl., 64(C):137-153, Apr. 2016. ISSN 1084-8045.
[4] C. W. Tsai, C. F. Lai, M. C. Chiang, and L. T. Yang. Data mining for internet of things: A survey. IEEE Communications Surveys Tutorials, 16(1):77-97, First 2014. ISSN 1553-877X.
[5] M.Sugiyama, M.Kawanbe, MIT Press (2012) Machine Learning in Non-Stationary Environments
[6] N. Kourtellis, G. De Francisci Morales, A. Bifet, A. Murdopo, IEEE conf. on Big Data 2016, "VHT: Vertical Hoeffding Tree",
[7] Heitor Murilo Gomes, Jean Paul Barddal, Fabrício Enembreck, and Albert Bifet. 2017. A Survey on Ensemble Learning for Data Stream Classification. ACM Comput. Surv. 50, 2, Article 23 (March 2017)
[8] Bifet, A. et al., Pitfalls in Benchmarking Data Stream Classification and How to Avoid Them, Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2013, Prague, Czech Republic, September 23-27, 2013, Proceedings, Part I, 2013, Springer Berlin Heidelberg
[9] Brzezinski, D. & Stefanowski, J. Knowl Inf Syst (2017). "Prequential AUC: properties of the area under the ROC curve for data streams with concept drift"

Entité

Cette thèse va s'intéresser à l'application des principes du « Machine Learning » en environnement non stationnaire dans le contexte des réseaux IoT.
Les principaux challenges sont:
  • Identifier les paramètres et indicateurs de mesures les plus pertinents pour l'analyse et la classification du trafic sur les réseaux IoT et des usages associés. Les tests McNemar's test, Cohen's Kappa ou Wilcox's signed-rank sont des critères possibles qui semblent être bien adaptés pour l'IoT [5,8].
  • Extension des techniques de Machine Learning permettant d'intégrer de manière pertinente ces indicateurs : utilisation par exemple d'une structure de décision en arbres tel que l'arbre de Hoeffding [6]
  • Bâtir une approche multicritère permettant d'améliorer l'exactitude des modèles [7] en proposant une intégration optimale, au sens de la performance, des résultats des deux étapes précédentes. Un critère particulièrement important d'appréciation de la performance sera la capacité à percevoir et réagir aux changements.
Approche méthodologique-planning
  • Dans un premier temps, une étude bibliographique sera nécessaire, à la fois pour se découvrir et comprendre le contexte et la particularité des réseaux IoT mais également se familiariser avec les travaux internes existant sur l'utilisation du machine learning et la supervision des réseaux IoT - "incremental statistical measures, decision trees adapted for incremental learning",
  • A partir de cette compréhension de technologies et des usages de l'IoT, proposition d'un premier ensemble de modèles unitaire pertinent, à la fois vis à vis du besoin mais également de la richesse des données exploitées.
  • Une fois ces modèles unitaires stabilisés, une démarche d'agrégation de ces modèles unitaires permettra de construire des entités de plus haut niveau correspondant à des évènements élémentaires au sens de l'activité du réseau IoT puis du service IoT. Pour ce faire, plusieurs pistes seront à investiguer : techniques de somme de probabilité, agrégation de distributions unitaires, agrégation prenant en compte les aspects spatio-temporels, ...
  • Puis construire des évènements de plus haut niveau à partir de ces évènements élémentaires, afin d'exploiter des modèles de niveau supérieur.
L'ensemble de cette étude devra se dérouler autant que possible avec des donnés représentatives de l'utilisation réelle des réseaux IoT d'Orange.

Contrat

Thèse