3
Capgemini Enterprise Content Management – The way we do IT Case study Capgemini Enterprise Content Management Content uit Livelink en SharePoint 2007, gekoppeld in SharePoint 2010 Yvo Booisma ECM Lead Capgemini Nederland [email protected] 06-52159343

Case study ECM content migration SharePoint and Livelink

Embed Size (px)

Citation preview

Page 1: Case study ECM content migration SharePoint and Livelink

Capgemini Enterprise Content Management – The way we do IT

Case study Capgemini Enterprise Content Management

Content uit Livelink en SharePoint 2007, gekoppeld in SharePoint 2010 Yvo Booisma ECM Lead Capgemini Nederland [email protected] 06-52159343

Page 2: Case study ECM content migration SharePoint and Livelink

Capgemini Enterprise Content Management – The way we do IT

Na de fusie van de Nederlandse en Duitse regio’s van een grote energiemaatschappij stond de organisatie voor de uitdaging van het samenvoegen van twee verschillende intranetten tot één corporate intranet. De twee regio’s gebruikten verschillende bronsystemen voor hun intranet: SharePoint 2007 en Livelink. De keuze voor het doelsysteem viel op SharePoint 2010. De samenvoeging van de twee verschillende omgevingen met enkele duizenden pagina’s en documenten met deels overlappende content betekende een complexe taak voor de communicatieafdelingen van de twee regio’s. Capgemini heeft hierin een adviserende rol kunnen spelen en de technische uitvoering van de contentmigratie voor haar rekening genomen. Inventarisatie en extractie Het uitgangspunt van het uiteindelijke migratieproces was de inventarisatie van SharePoint 2007 en Livelink, de bronsystemen van de twee intranetten. Daarvoor zijn op locatie een aantal robots ontwikkeld die de gehele voorkant van de twee omgevingen crawlen om zo alle toegankelijke content in kaart te brengen. Ook is er een reconstructie van de structuur van de content in de omgevingen gemaakt. Tijdens dit proces werd elke geïnventariseerde pagina en document geëxtraheerd, inclusief aanwezige metadata. Mapping Op basis van de inventarisatie zijn twee sitemaps gegenereerd die de structuur van alle content eenduidig inzichtelijk maakten. Hiermee openbaarde zich de grote uitdaging om die twee structuren deels samen te voegen tot één overkoepelende structuur. Aangezien de twee bronsites verschillend van taal waren, is ervoor gekozen om de overkoepelende structuur in het Engels te definiëren. Zodoende ontstond er een drietalig doelsysteem, waarbij het Engels het gemeenschappelijke deel vertegenwoordigde. Dit betekende dat op basis van de twee sitemaps drie doelstructuren gemaakt moesten worden die opgesteld werden in drie mappingsheets. De grote uitdaging was om overeenkomstige pagina’s uit de twee bronsystemen te koppelen als gelokaliseerde versies van dezelfde content. Dit werd opgelost door overeenkomstige pagina’s in de Nederlandse en Duitse mappingsheet te koppelen aan een overeenkomstige nieuwe pagina in de Engelse mappingsheet middels een gedeelde mapping ID. De grote uitdaging was om overeenkomstige pagina’s uit de twee bronsystemen te koppelen als gelokaliseerde versies van dezelfde content Naast het herdefiniëren van de sitestructuur, werden ook de contenttypen opnieuw gedefinieerd. Om de gegevens uit alle velden uit de bronsystemen te migreren naar de overeenkomstige velden in het doelsysteem, is er ook een mapping gemaakt van oude naar nieuwe contenttypen en de bijbehorende velden. Transformatie Nadat alle pagina’s op de gewenste posities in de mappingsheets gezet waren, kon de import naar het doelsysteem voorbereid worden. In deze fase hebben alle pagina’s een aantal transformatiestappen ondergaan: Case study – Content uit Livelink en SharePoint 2007, gekoppeld in SharePoint 2010 2

Page 3: Case study ECM content migration SharePoint and Livelink

Capgemini Enterprise Content Management – The way we do IT

Opschonen Tussen de twee bronsystemen bestonden grote verschillen in de wijze waarin content opgemaakt was. Ook binnen hetzelfde bronsysteem waren er soms grote variaties in de lay-out van de artikelen. Daarom hebben alle pagina’s een geautomatiseerde schoonmaakbeurt ondergaan waabij alle uitwassen uit de bron HTML verwijderd is, en uiteindelijk schone en consistente XHTML is opgeleverd. Verrijken Naast het opschonen van de content is deze ook verrijkt met metadata die niet in de doelsystemen aanwezig waren. Deze metadata kon eenvoudig door de redactie per pagina aan de drie mappingsheets toegevoegd worden. Dit scheelde de redactie een grote nabewerkingsklus. Conversie naar XML De laatste transformatiestap was een conversie naar XML. Hierbij zijn alle pagina’s omgezet naar een specifiek XML formaat zodat deze in een later stadium eenvoudig ingelezen konden worden door de importer. Ook de mappingsheets waarin de structuur gedefinieerd is, zijn omgezet naar een XML formaat, zodat ook deze verwerkt konden worden tijdens de import. Import Voor de uiteindelijke import naar SharePoint 2010 heeft Capgemini een generieke importer ontwikkeld die rechtstreeks met de SharePoint API communiceert. Deze importer leest de getransformeerde XML in en maakt op basis daarvan de pagina’s, subsites en documenten aan in SharePoint 2010. Ook controleert de importer alle content op links, en worden alle interne verwijzingen bijgewerkt. Op deze manier werd de geautomatiseerde contentmigratie naar SharePoint 2010 uiteindelijk

gerealiseerd. Na afloop van de migratie werd er voor elke taal een testsheet opgeleverd waarin voor

elke pagina in de doelstructuur de url van de pagina in het bronsysteem en in SharePoint 2010

weergegeven werd. Dit bleek uiteindelijk een uitstekende referentie voor de testers om de content

in de bron- en doelsystemen met elkaar te vergelijken.

Resultaat De gehanteerde methode van automatische content migratie heeft geleidt tot:

Geen Content Freeze periode;

Gebruikers hebben geen last ervaren;

Nauwelijks uitval van content tijdens de migratie (<0,5%);

De migratieperiode was significant korter dan een traditionele methode;

De kosten voor de conversie waren significant lager dan alternatieve methoden en aanbieders.