Gestion de la distribution dans les méthodes d'AS
Bonjour, J'ai un peu progressé dans la compréhension de l'utilisation de la distribution dans les méthodes d'AS. Il y a plusieurs cas: * soit la méthode prend en paramètres la distribution directement (Fast99) * soit des paramètres de la distribution peuvent être calculé avant par une distribution (Sobol) * soit la méthode gère elle même la distribution, non modifiable (LHS) * soit la distribution ne peut pas être gérée Voici en détail les problèmes rencontrés suivant les méthodes de calcul: Morris ------ Morris prend en paramètres deux vecteurs correspondant aux valeurs min et max de chaque facteur. Si les facteurs n'ont pas été défini en distribution uniforme avec des valeurs min et max, cela pose problème. Sobol ----- Sobol prend en paramètres 2 dataframe qui peuvent être défini manuellement suivant une méthode de distribution. C'est donc théoriquement possible. RandomLHS et OptimumLHS ----------------------- RandomLHS gère elle même une distribution uniforme entre 0 et 1. help(randmonLHS) : An ‘n’ by ‘k’ Latin Hypercube Sample matrix with values uniformly distributed on [0,1] Donc en faisant un produit en croix entre min et max, il est possible d'obtenir la valeur réelle du facteur. Mais dans le cas d'une distribution non uniforme, comment peut-on exploiter la valeur entre 0 et 1 ? ExpandGrid ---------- Pas de gestion de la distribution. RDOpimal -------- Pas de gestion de la distribution. Apparemment Sigrid avait bien aidé Jean sur ce script. RegularFraction --------------- Pas de gestion de la distribution. JavaExpandGrid et FrF2 ---------------------- JavaExpandGrid calcule manuellement les valeurs des facteurs. Donc a moins de refaire le calcul pour toutes les distributions possibles, autant supprimer cette méthode. FrF2 est la même méthode que RegularFraction. Stéphanie, tu aurais un moment pour rediscuter de ca ? -- Éric Chatellier <chatellier@codelutin.com> Tel: 02.40.50.29.28 http://www.codelutin.com
On a un peu avancé avec Jean sur la gestion de la distribution par les méthode d'AS. Ca fonctionne sur des cas simples. Le 08/06/2012 15:38, Eric Chatellier a écrit :
Morris ------ Morris prend en paramètres deux vecteurs correspondant aux valeurs min et max de chaque facteur. Si les facteurs n'ont pas été défini en distribution uniforme avec des valeurs min et max, cela pose problème. Morris fonctionne avec des facteurs uniformes.
On peut donc utiliser Morris avec très peu de distribution.
Sobol ----- Sobol prend en paramètres 2 dataframe qui peuvent être défini manuellement suivant une méthode de distribution. C'est donc théoriquement possible. Sobol fonctionne avec n'importe quel type de distribution.
Les autres méthodes sont en cours de codage et tests. J'ai un problème par contre, pour le Group Screening. Pour rappel, en version 4.2: - un groupe de facteur continue ne peut contenir que des facteurs continues - un groupe de facteur discret peut contenir des facteurs discrets ET continue Seulement, pour gérer un groupe de facteur comme un groupe de facteur, on doit considérer qu'il a un domaine qui dépend des facteurs qui le compose. Comment peut-on définir le domaine d'un groupe de facteur en fonction des domaine des facteurs (en particulier la distribution de ce domaine) ? Un groupe de facteur peut-il être composé de domaine avec des distributions différentes ? Ex : - facteur 1 : distribution uniforme min/max - facteur 2 : distribution normale Quel est la distribution du groupe de ces deux facteurs ? -- Éric Chatellier - Code Lutin Tel: 02.40.50.29.28 - http://www.codelutin.com
On a un peu avancé avec Jean sur la gestion de la distribution par les méthode d'AS.
Ca fonctionne sur des cas simples.
Le 08/06/2012 15:38, Eric Chatellier a écrit :
Morris ------ Morris prend en paramètres deux vecteurs correspondant aux valeurs min et max de chaque facteur. Si les facteurs n'ont pas été défini en distribution uniforme avec des valeurs min et max, cela pose problème. Morris fonctionne avec des facteurs uniformes.
On peut donc utiliser Morris avec très peu de distribution.
Sobol ----- Sobol prend en paramètres 2 dataframe qui peuvent être défini manuellement suivant une méthode de distribution. C'est donc théoriquement possible. Sobol fonctionne avec n'importe quel type de distribution.
Les autres méthodes sont en cours de codage et tests.
J'ai un problème par contre, pour le Group Screening. Pour rappel, en version 4.2: - un groupe de facteur continue ne peut contenir que des facteurs continues - un groupe de facteur discret peut contenir des facteurs discrets ET continue
Seulement, pour gérer un groupe de facteur comme un groupe de facteur, on doit considérer qu'il a un domaine qui dépend des facteurs qui le compose.
Comment peut-on définir le domaine d'un groupe de facteur en fonction des domaine des facteurs (en particulier la distribution de ce domaine) ? le domaine du groupe est multidimensionnel, c'est à dire D1 (par exemple [1,7])domaine facteur 1 D2 (par exemple {1,3,5,7,10, 11}) domaine facteur 2 alors le domaine du groupe est D1xD2 ([1,7]x{1,3,5,7,10, 11}) cela signifie que le domaine du groupe se déduit directement du domaine des facteurs du groupe
Un groupe de facteur peut-il être composé de domaine avec des distributions différentes ? Ex : - facteur 1 : distribution uniforme min/max - facteur 2 : distribution normale Quel est la distribution du groupe de ces deux facteurs ? c'est un peu comme pour les domaines. La distribution du groupe est le
Le 15/11/2013 10:20, Eric Chatellier a écrit : produit des distributions marginales (distribution de chaque facteur) car par défaut, on fait l'hypothèse que les facteurs d'un groupe sont indépendants. On peut laisser la possibilité aux utilisateurs très avancés de mettre une distribution jointe différente du produit des distributions marginales mais il faudra qu'ils saisissent eux-même la fonction de distribution. Par défaut , un utilisateur lambda saisira simplement le nombre de modalités souhaitées pour son groupe et ISIS tirera dans chaque distribution des facteurs du groupe ce nombre de modalités. Stephanie
-- ...................................................................... Stephanie MAHEVAS (Stephanie.Mahevas@ifremer.fr) IFREMER/EMH (Ecologie et Modèles pour l'Halieutique) Tel: (33) 2 40 37 41 81 Fax: (33) 2 40 37 40 75 o \ o / _ o __| \ / |__ o _ \ o / o /|\ | /\ ___\o \o | o/ o/__ /\ | /|\ / \ / \ | \ /) | ( \ /o\ / ) | (\ / | / \ / \ ......................................................................
J'ai un problème par contre, pour le Group Screening. Pour rappel, en version 4.2: - un groupe de facteur continue ne peut contenir que des facteurs continues - un groupe de facteur discret peut contenir des facteurs discrets ET continue
Seulement, pour gérer un groupe de facteur comme un groupe de facteur, on doit considérer qu'il a un domaine qui dépend des facteurs qui le compose.
Comment peut-on définir le domaine d'un groupe de facteur en fonction des domaine des facteurs (en particulier la distribution de ce domaine) ? le domaine du groupe est multidimensionnel, c'est à dire D1 (par exemple [1,7])domaine facteur 1 D2 (par exemple {1,3,5,7,10, 11}) domaine facteur 2 alors le domaine du groupe est D1xD2 ([1,7]x{1,3,5,7,10, 11}) cela signifie que le domaine du groupe se déduit directement du domaine des facteurs du groupe
Je ne comprend pas comment mettre cela en application dans Isis. Par exemple, si j'ai deux facteurs dans un groupe G1: * D1 : distribution uniforme min/max (0, 10) * D2 : distribution normale dlnorm (meanlog = 0, sdlog = 1) Comment dont-on considérer le domaine de G1 pour que R puisse calculer les valeurs de domaine de G1 à répercuter sur D1 et D2 ? Je dit peut-être une bêtise, mais R sait gérer les domaines multidimensionnel directement ? -- Éric Chatellier
nan R ne sait pas gérer ça de cette manière (enfin pas à ma connaissance) Le 21/11/2013 22:30, Eric Chatellier a écrit :
J'ai un problème par contre, pour le Group Screening. Pour rappel, en version 4.2: - un groupe de facteur continue ne peut contenir que des facteurs continues - un groupe de facteur discret peut contenir des facteurs discrets ET continue
Seulement, pour gérer un groupe de facteur comme un groupe de facteur, on doit considérer qu'il a un domaine qui dépend des facteurs qui le compose.
Comment peut-on définir le domaine d'un groupe de facteur en fonction des domaine des facteurs (en particulier la distribution de ce domaine) ? le domaine du groupe est multidimensionnel, c'est à dire D1 (par exemple [1,7])domaine facteur 1 D2 (par exemple {1,3,5,7,10, 11}) domaine facteur 2 alors le domaine du groupe est D1xD2 ([1,7]x{1,3,5,7,10, 11}) cela signifie que le domaine du groupe se déduit directement du domaine des facteurs du groupe Je ne comprend pas comment mettre cela en application dans Isis.
Par exemple, si j'ai deux facteurs dans un groupe G1: * D1 : distribution uniforme min/max (0, 10) * D2 : distribution normale dlnorm (meanlog = 0, sdlog = 1)
Comment dont-on considérer le domaine de G1 pour que R puisse calculer les valeurs de domaine de G1 à répercuter sur D1 et D2 ?
Je dit peut-être une bêtise, mais R sait gérer les domaines multidimensionnel directement ?
-- ...................................................................... Stephanie MAHEVAS (Stephanie.Mahevas@ifremer.fr) IFREMER/EMH (Ecologie et Modèles pour l'Halieutique) Tel: (33) 2 40 37 41 81 Fax: (33) 2 40 37 40 75 o \ o / _ o __| \ / |__ o _ \ o / o /|\ | /\ ___\o \o | o/ o/__ /\ | /|\ / \ / \ | \ /) | ( \ /o\ / ) | (\ / | / \ / \ ......................................................................
Le 22/11/2013 10:50, Stephanie MAHEVAS a écrit :
nan R ne sait pas gérer ça de cette manière (enfin pas à ma connaissance) Et tu as une idée de la façon dont un peut gérer manuellement une distribution d'un groupe correspondant à deux distributions différentes pour les domaines ?
-- Éric Chatellier - Code Lutin Tel: 02.40.50.29.28 - http://www.codelutin.com
c'est un peu ce que j'ai décrit dans mon premier message :-\ 2 cas de figure 1. les deux distributions sont independantes : alors on tire dans chacune des distributions 2. les distributions sont corrélées : 2 cas de figures 2.1 on connait la distribution jointe et l'utilisateur la saisie, puis on tire dans cette distribution 2.2 on sait pas faire Je proposais que l'on se contente de traiter le cas 1 pour l'instant, mais que l'on puisse, à terme, envisager que l'utilisateur très averti d'ISIS puisse saisir la distribution jointe. Traiter le cas 1 revient à G = {X1,X2} X1 facteur 1, D1 domaine de X1, f1 distribution de X1 X2 facteur 2, , D2 domaine de X2, f2 distribution de X2 1. afficher D = D1xD2 = [minD1,maxD1]X[minD2,maxD2], pour des facteurs continus = [minD1,maxD1]X[liste des valeurs de D2], pour 1 facteur continu et 1 facteur discret 2. si le nombre de modalités pour G est n, alors il faut tirer n valeurs de X1 dans D1 avec la distribution f1: x11, ..., x1n il faut tirer n valeurs de X2 dans D2 avec la distribution f2: x21,..., x2n les n valeurs de G seront : g1= (x11,x21),...,gn=(x1n,x2n) Le 22/11/2013 10:58, Eric Chatellier a écrit :
Le 22/11/2013 10:50, Stephanie MAHEVAS a écrit :
nan R ne sait pas gérer ça de cette manière (enfin pas à ma connaissance) Et tu as une idée de la façon dont un peut gérer manuellement une distribution d'un groupe correspondant à deux distributions différentes pour les domaines ?
-- ...................................................................... Stephanie MAHEVAS (Stephanie.Mahevas@ifremer.fr) IFREMER/EMH (Ecologie et Modèles pour l'Halieutique) Tel: (33) 2 40 37 41 81 Fax: (33) 2 40 37 40 75 o \ o / _ o __| \ / |__ o _ \ o / o /|\ | /\ ___\o \o | o/ o/__ /\ | /|\ / \ / \ | \ /) | ( \ /o\ / ) | (\ / | / \ / \ ......................................................................
participants (2)
-
Eric Chatellier -
Stephanie MAHEVAS