Akzentierte Zeichen (Umlaute usw.) nicht in Entities encoden

Gesperrt
kleena
Beiträge: 9
Registriert: Mo 16. Jun 2008, 21:39
Kontaktdaten:

Akzentierte Zeichen (Umlaute usw.) nicht in Entities encoden

Beitrag von kleena » Mo 16. Jun 2008, 21:52

Hallo,
ich setze eine Webseite mit Contenido auf und habe mit ein paa Problemen zu kämpfen.
Eins davon ist, dass in der Ausgabe alle Sonderzeichen, deutsche Umlaute und Ähnliche, in HTML-Entities umkodiert werden (ü usw.). Ich habe schon die Sprache in UTF-8 geändert, in der Hoffnung, dass dies wegen des Latin-1 Encodings passiert. Leider wird in meinem UTF-8 genauso umcodiert.
Auf der Contenido-Homepage sehe ich aber wunderschöne Umlaute...

Kann man das Umcoden der Ausgabe irgendwo umschalten, oder liegt es vielleicht an falscher Einstellung des Datenbank-Encodings...?

Danke vielmals,
kleena k.

holger.librenz_4fb

Beitrag von holger.librenz_4fb » Mo 16. Jun 2008, 22:33

Hallo kleena.

Wieso willst Du dieses valide HTML Enkodieren ausschalten? Egal welches Encoding gewählt ist, Sonderzeichen und Umlaute gehören für HTML entsprechend enkodiert.
Wenn Du es für eine Ausgabe brauchst, die nicht HTML ist, kannst Du die Enkodierung natürlich entsprechend umkehren respektive gar nicht erst einbauen :)

So long,
Holger

kleena
Beiträge: 9
Registriert: Mo 16. Jun 2008, 21:39
Kontaktdaten:

Beitrag von kleena » Mo 16. Jun 2008, 22:43

...und ich dachte immer, im HTML darf alles vorkommen, was nach dem gewählten Encoding Text ist. In Latin 1 sind deutsche Umlaute völlig legal, in UTF-8 auch z.B. kyrillische Zeichen.
Purismus hier oder da - ja, ich möchte, dass solche Zeichen nicht encoded werden, so, wie es (meiner Meinung nach) die Suchmaschinen und auch Menschen beim Suchen mögen. Ein "ü" oder "ß" soll genauso ausgegeben werden.

Um die Encodierung geht es mir eben - wo steckt sie drin, ist sie immer aktiv? Wie gesagt - z.B. die Contenido-Website klann das, so nehme ich an, es ist mit Contenido möglich.

Danke :-)

holger.librenz_4fb

Beitrag von holger.librenz_4fb » Di 17. Jun 2008, 06:13

Du handelst Dir damit allerdings nur Probleme ein. Diese Enkodierung ist zum Beispiel für die Rechner gedacht, die schlichtweg Deine Sonderzeichen nicht anzeigen können. Ansonsten verhalten sich ü und ü äquivalent zueinander - sowohl Suchmaschinen als auch Browser erlauben Dir eine (ausschliessliche) Suche nach "ü". Eine andere Sache ist die Enkodierung in HTML Attributen und JavaScript, hier müssen - wenn überhaupt - diese unkodiert erscheinen.

Wenn es aber unbedingt nicht standardkonform sein soll: Die Enkodierung geschieht durch den Tiny und teilweise durch Postprocessing im Contenido. Du könntest in den entsprechenden Modulen ein html_entity_decode() benutzen um sie wieder herauszufiltern. Ich kann davon aber nur abraten!
kleena hat geschrieben:Wie gesagt - z.B. die Contenido-Website klann das
Hmm, hilf mir kurz schauen - wo ist denn auf der contenido.org ein nicht enkodiertes Sonderzeichen?

So long,
Holger

kleena
Beiträge: 9
Registriert: Mo 16. Jun 2008, 21:39
Kontaktdaten:

Beitrag von kleena » Di 17. Jun 2008, 09:45

holger.librenz_4fb hat geschrieben:Du handelst Dir damit allerdings nur Probleme ein. Diese Enkodierung ist zum Beispiel für die Rechner gedacht, die schlichtweg Deine Sonderzeichen nicht anzeigen können. Ansonsten verhalten sich ü und ü äquivalent zueinander
Ich kann die Gründe dafür verstehen, alllerdings ist mir nicht bewusst, dass dies durch den Standard vorgeschrieben wäre, vielmehr halten es schlicht manche für "best practice". Ich selbst halte nicht viel davon, denn nimmt man an, dies wäre der Fall, würde z.B. UTF-8 im HTML keinen Sinn haben, weil man ja ohnehin alles in Entities umwandeln müsste. Wozu dann UTF-8, um reines ASCII auszudrücken? Darüber hinaus, ist dies der Fall und habe ich meine Templates voller Entity-Kodi, wie suche ich dann nach dem Wort "Köter"? Muss ich dann jedesmal auch die Entity eintippen? Oder soll das der Editor können? Welcher kann das?
holger.librenz_4fb hat geschrieben:
kleena hat geschrieben:Wie gesagt - z.B. die Contenido-Website klann das
Hmm, hilf mir kurz schauen - wo ist denn auf der contenido.org ein nicht enkodiertes Sonderzeichen?
Das muss ich zurücknemhen, Du hast Recht. Gestern war ich mir sicher es dort gesehen zu haben, jetzt wieder nicht mehr. Trotzdem, Contenido-Sites und AfterBuy sind die Einzigen, die heute noch sowas machen. Ich arbeite lange genug im Web-Development und eine Information, dies wäre vorteilhafter oder sogar lt. Standard erforderlich, ist mir in den moderneren Zeiten noch nicht über den Weg gekommen.

Ich verstehe Dich also so, dass sowas in Contenido wohl nicht voeregesen ist, wenn man es haben möchte, müsste man entsprechende Stellen finden und "verstümmeln". Richtig?

Danke.

mko
Beiträge: 123
Registriert: Di 1. Feb 2005, 10:26
Wohnort: Österreich
Kontaktdaten:

Beitrag von mko » Mo 11. Aug 2008, 09:08

Ich stehe vor einem ähnlichen Problem - Contenido 4.8.6 enkodiert einige Seiten und einige nicht. Daraus resultiert ein großes Problem bei der Suche bzw. beim Ergebnis der Suche. Ergebnisse in denen die Sonderzeichen enkodet werden, werden richtig angezeigt andere eben nicht.

Wir erstellen alle Seiten im UTF-8 Format und das in mehr als 20 Sprachen - wie können wir dieses Such/Find Problem lösen?

derSteffen
Beiträge: 847
Registriert: Mi 14. Dez 2005, 16:15
Wohnort: Königs Wusterhausen bei Berlin
Kontaktdaten:

Beitrag von derSteffen » Mi 27. Aug 2008, 21:29

Mhm,

leider habe ich das Problem mit den UTF-8 jetzt auch und im Zuge von AJAX welches ja UTF-8 Ergebnisse liefert müßte man das doch irgendwie hinbekommen.

MfG Steffen

Gesperrt