Voici comment fonctionne le système de recommandation top secret de Netflix – Wired.co.uk

Plus de 80% des émissions télévisées que les gens regardent sur Netflix sont découvertes grâce au système de recommandations de la plate-forme. Cela signifie que la majorité de ce que vous décidez de regarder sur Netflix est le résultat de décisions prises par une mystérieuse boîte noire d’un algorithme. Intrigué? Voici comment ça fonctionne.

Netflix utilise l’apprentissage automatique et des algorithmes pour aider à briser les idées préconçues des téléspectateurs et à trouver des émissions qu’ils n’auraient peut-être pas choisies initialement. Pour ce faire, il examine des fils nuancés au sein du contenu, plutôt que de s’appuyer sur de larges genres pour faire ses prédictions. Cela explique comment, par exemple, une personne sur huit qui regarde l’une des émissions Marvel de Netflix est complètement nouvelle dans les trucs basés sur la bande dessinée sur Netflix.

Le jeu de streaming de Disney consiste à ne pas se faire manger par Netflix

Pour aider à comprendre, pensez à un tabouret à trois pattes. « Les trois jambes de ce tabouret seraient les membres de Netflix; les tagueurs qui comprennent tout sur le contenu; et nos algorithmes d’apprentissage automatique qui prennent toutes les données et rassemblent les choses », explique Todd Yellin, vice-président de l’innovation produit de Netflix.

Alors que Netflix compte plus de 100 millions d’utilisateurs dans le monde, si les multiples profils d’utilisateurs pour chaque abonné sont comptés, cela porte le total à environ 250 millions de profils actifs. « Ce que nous voyons dans ces profils, ce sont les types de données suivants – ce que les gens regardent, ce qu’ils regardent après, ce qu’ils regardent avant, ce qu’ils ont regardé il y a un an, ce qu’ils ont regardé récemment et à quelle heure de la journée ». Ces données constituent la première jambe du tabouret métaphorique.

Ces informations sont ensuite combinées avec plus de données visant à comprendre le contenu des émissions. Ce dernier – la deuxième jambe du tabouret – est rassemblé auprès de dizaines de collaborateurs internes et indépendants qui regardent chaque minute ou chaque émission sur Netflix et le taguent. Les balises qu’ils utilisent vont massivement de la façon dont la pièce est cérébrale, à savoir si elle a un casting d’ensemble, est placée dans l’espace ou met en vedette un flic corrompu.

« Nous prenons toutes ces balises et les données de comportement des utilisateurs, puis nous utilisons des algorithmes d’apprentissage machine très sophistiqués qui déterminent ce qui est le plus important – que devons-nous peser », explique Yellin. « Quelle importance cela devrait-il avoir si un consommateur regardait quelque chose hier? Cela devrait-il compter deux fois plus ou dix fois plus par rapport à ce qu’il a regardé il y a un an? Qu’en est-il il y a un mois? Et si il regardait dix minutes de contenu et l’ont abandonné ou l’ont traversé en deux nuits? Comment pesons-nous tout cela? C’est là que l’apprentissage automatique entre en jeu. Ce que ces trois choses créent pour nous, ce sont les « communautés gustatives » du monde entier. Il s’agit de gens qui regardent le même genre de les choses que vous regardez. « 

Les téléspectateurs s’intègrent dans plusieurs groupes de goûts – dont il y a « quelques milliers » – et ce sont ceux-ci qui affectent les recommandations qui apparaissent en haut de votre interface à l’écran, les lignes de genre affichées et la façon dont chaque ligne est ordonnée pour chaque individu téléspectateur. Les balises utilisées pour les algorithmes d’apprentissage automatique sont les mêmes à travers le monde. Cependant, un plus petit sous-ensemble de balises est utilisé d’une manière plus tournée vers l’extérieur, alimentant directement l’interface utilisateur et différant selon le pays, la langue et le contexte culturel. «Celles-ci doivent être localisées de manière logique», explique Yellin. « Par exemple, le mot » granuleux  » [as in, ‘gritty drama’] ne peut pas traduire en espagnol ou en français. « 

La prochaine révolution médiatique viendra des voitures sans conducteur

Les données que Netflix alimente dans ses algorithmes peuvent être divisées en deux types – implicites et explicites. « Les données explicites sont ce que vous nous dites: vous donnez un coup de pouce La Couronne, nous l’obtenons », explique Yellin. « Les données implicites sont vraiment des données comportementales. Vous ne nous avez pas dit explicitement: » J’ai aimé Incassable Kimmy Schmidt‘, vous venez de le croquer et de le regarder en deux nuits, donc nous comprenons cela comportementalement. La majorité des données utiles est implicite. « 

Pour illustrer comment toutes ces données sont réunies pour aider les téléspectateurs à trouver de nouvelles choses à regarder, Netflix a examiné les modèles qui ont conduit les téléspectateurs vers les personnages Marvel qui composent Les défenseurs. Bien qu’il y ait eu des tendances plus évidentes, telles que les séries avec de fortes pistes féminines – comme Orange est le nouveau noir – orienter les personnages vers Jessica Jones, il y avait aussi quelques sources moins évidentes, comme l’humour intelligent de Maître de rien et le frisson psychologique de Faire un meurtrier conduire les gens vers le détective privé sage. Pendant ce temps, « montre que révéler le côté sombre de la société » a été montré pour conduire les téléspectateurs à Luke Cage, comme la question de la culpabilité Amanda Knox et l’examen de la technologie dans Miroir noir.

Vous aimerez aussi...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *