L’indel est un terme de biologie moléculaire désignant une insertion ou une délétion de bases dans le génome d’un organisme. Il est classé parmi les petites variations génétiques, mesurant de 1 à 10 000 paires de bases, y compris les événements d’insertion et de délétion qui peuvent être séparés par de nombreuses années, et peuvent ne pas être liés les uns aux autres de quelque manière que ce soit.Un microindel est défini comme un indel qui entraîne un changement net de 1 à 50 nucléotides.
Dans les régions codantes du génome, à moins que la longueur d’un indel soit un multiple de 3, il produira une mutation de type frameshift. Par exemple, un microindel commun qui entraîne un décalage de cadre provoque le syndrome de Bloom dans la population juive ou japonaise. Les indels peuvent être comparés à une mutation ponctuelle. Un indel insère et supprime des nucléotides d’une séquence, tandis qu’une mutation ponctuelle est une forme de substitution qui remplace un des nucléotides sans changer le nombre total dans l’ADN. Les indels peuvent également être opposés aux mutations de bases en tandem (TBM), qui peuvent résulter de mécanismes fondamentalement différents. Une TBM est définie comme une substitution à des nucléotides adjacents (principalement des substitutions à deux nucléotides adjacents, mais des substitutions à trois nucléotides adjacents ont été observées).
Les indels, étant soit des insertions, soit des délétions, peuvent être utilisés comme marqueurs génétiques dans les populations naturelles, notamment dans les études phylogénétiques. Il a été démontré que les régions génomiques comportant de multiples indels peuvent également être utilisées pour des procédures d’identification d’espèces.
Un changement d’indel d’une seule paire de bases dans la partie codante d’un ARNm entraîne un décalage de cadre pendant la traduction de l’ARNm qui pourrait conduire à un codon stop inapproprié (prématuré) dans un cadre différent. Les indels qui ne sont pas des multiples de 3 sont particulièrement rares dans les régions codantes mais relativement courants dans les régions non codantes. Il y a environ 192 à 280 indels de décalage de cadre chez chaque personne. Les indels représentent probablement entre 16 et 25 % de tous les polymorphismes de séquence chez l’homme. En fait, dans la plupart des génomes connus, y compris celui de l’homme, la fréquence des indels tend à être nettement inférieure à celle des polymorphismes nucléotidiques simples (SNP), sauf près des régions hautement répétitives, y compris les homopolymères et les microsatellites.
Le terme « indel » a été coopté ces dernières années par les génomistes pour être utilisé dans le sens décrit ci-dessus. Il s’agit d’un changement par rapport à son utilisation et à sa signification originales, qui découlaient de la systématique. En systématique, les chercheurs pouvaient trouver des différences entre les séquences, par exemple celles de deux espèces différentes. Mais il était impossible de déduire si une espèce avait perdu la séquence ou si l’autre l’avait gagnée. Par exemple, l’espèce A possède une série de nucléotides 4 G à un locus et l’espèce B possède 5 G au même locus. Si le mode de sélection est inconnu, on ne peut pas dire si l’espèce A a perdu un G (un événement de « délétion ») ou si l’espèce B a gagné un G (un événement d' »insertion »). Lorsque l’on ne peut pas déduire la direction phylogénétique du changement de séquence, l’événement de changement de séquence est appelé « indel ».