Hvordan fjerne Registrerte, varemerker og Copyright fra en streng?

stemmer
0

Jeg har en dataframe med objektnavn. Noen av gjenstandene har spesielle symboler som ® og ™

Eksempel:
ProStand® Front Air Suspension
Onco ™ Connector

Jeg har prøvd db[grep(®,db$objectName), ]å finne de spesielle symboler, men R er ikke plukke den opp, selv om jeg ser dem i dataframe.

Dette fungerte ikke heller
db$objectName[db$objectName == ProStand® Front Air Suspension ]<- ProStand Front Air Suspension

Hvordan finner jeg spesialtegnene og fjerne dem fra strengene i min dataframe?

Publisert på 10/10/2019 klokken 00:02
kilden bruker
På andre språk...                            


2 svar

stemmer
1

Hvis du leter etter noe litt mer generisk, hjelp stringr, kan du prøve med, for eksempel:

str_remove(string = "ProStand® Front Air Suspension", pattern = "[^[:alnum:][:space:]]+")

som gir

"ProStand Front Air Suspension"

Dette fjerner i utgangspunktet alt som ikke er et tall, ikke et brev, og ikke en plass.

Svarte 10/10/2019 kl. 00:10
kilden bruker

stemmer
0

Her er en ved å matche Unicode karakter og erstatte den med blank

library(stringr)
str_replace_all(str1, "\\u00AE|\\u00a9|\\u2122", "")
#[1] "ProStand Front Air Suspension"

data

str1 <- "ProStand® Front Air© Suspension™"
Svarte 10/10/2019 kl. 00:17
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more